728x90
10. 직업의 시작
- 아이디어의 현실화에는 데이터가 필요 : 현실을 데이터로 표현 가능하다면 컴퓨터를 통한 처리가 가능
- 세상 모든 일은 작든, 크든, 데이터로 표현 가능
- 복잡한 현실을 데이터를 단순화할 필요 : 복잡한 현실로 발견하기 어려운 통찰을 단순화하여 판단 가능
- 데이터 산업 : 데이터 과학 + 데이터 공학
- 데이터 과학 : 데이터를 만들고, 만들어진 데이터를 이용 (데이터 자체를 다룸)
- 데이터 공학 : 데이터를 다루는 도구를 만들고 이를 관리 (데이터 관리를 도움)
11. 표
- 표 : 행(가로)/열(세로)로 구성된 양식에 데이터를 넣는 억압적인(?) 도구
- 아무리 복잡하더라도 일단 표 내에 속박-정리 정돈 가능
- 컴퓨터의 용량과 처리 속도를 이용 가능
- 머신러닝을 조합 시 기계에게 통찰력을 부여 가능
- 데이터 산업에서의 표는 왼쪽과 같이 표현
- 표 = data set
- 각 열은 데이터의 속성을, 각 행은 개체를 나타냄
- 행 = 개체(Instance), 관측치(observed value), 기록(record), 사례(example), 경우(case) ...
- 열 = 특성(feature), 속성(attribute), 변수(variable), 필드(field) ...
12. 독립변수와 종속변수
- 표 속에 구성된 데이터에서, 의미 있는 정보를 뽑아내어야 함
- 변수(Variable)
- x=1, x=2에서 x는 변할 수 있는 값, 변수
- 표에서의 변수는 열(column)을 의미
- 독립변수 : 원인
- 원인 : 결과와 무관하게 발생하는 사건
- 종속변수 : 결과
- 결과 : 원인에 종속되어 일어나는 사건
- 서로 상관이 있는 특성 : 한 쪽의 값이 바뀔 때 다른 값이 바뀌는 것(= 상관관계)
- 변수 A, B의 변화가 일정하게 나타나고,
- A-B 관계 외에 다른 영향을 주는 요소가 없을 때,
- 인과관계에 따라 A에 의해 B가 변화한다면 A는 독립변수, B는 종속변수
- 모든 인간관계는 상관관계 / 모든 상관관계가 인과관계는 아님
13. 심리전
- 공부를 그만두고 싶을 때
- 지금 하고 있는 행위가 경제성이 없다고 생각할 때,
- 우리 뇌는 1차로 지루함을, 2차로 절망감을 나타낸다.
- 이러한 경고를 무시하면, 앞으로 비슷한 경험을 겪을 때 거부감을 느끼게 된다.
- 지루함을 느끼게 되면 과감하게 공부를 유보하자
- 수동적인 포기가 아닌, 능동적 유보의 전략을 취하자
728x90