728x90
10. 직업의 시작

10. 직업의 시작

  • 아이디어의 현실화에는 데이터가 필요 : 현실을 데이터로 표현 가능하다면 컴퓨터를 통한 처리가 가능
  • 세상 모든 일은 작든, 크든, 데이터로 표현 가능
    • 복잡한 현실을 데이터를 단순화할 필요 : 복잡한 현실로 발견하기 어려운 통찰을 단순화하여 판단 가능
  • 데이터 산업 : 데이터 과학 + 데이터 공학
    • 데이터 과학 : 데이터를 만들고, 만들어진 데이터를 이용 (데이터 자체를 다룸)
    • 데이터 공학 : 데이터를 다루는 도구를 만들고 이를 관리 (데이터 관리를 도움)

11. 표

  • 표 : 행(가로)/열(세로)로 구성된 양식에 데이터를 넣는 억압적인(?) 도구
    • 아무리 복잡하더라도 일단 표 내에 속박-정리 정돈 가능
    • 컴퓨터의 용량과 처리 속도를 이용 가능
    • 머신러닝을 조합 시 기계에게 통찰력을 부여 가능

  • 데이터 산업에서의 표는 왼쪽과 같이 표현
    • 표 = data set
    • 각 열은 데이터의 속성을, 각 행은 개체를 나타냄
    • 행 = 개체(Instance), 관측치(observed value), 기록(record), 사례(example), 경우(case) ...
    • 열 = 특성(feature), 속성(attribute), 변수(variable), 필드(field) ...

12. 독립변수와 종속변수

  • 표 속에 구성된 데이터에서, 의미 있는 정보를 뽑아내어야 함
  • 변수(Variable)
    • x=1, x=2에서 x는 변할 수 있는 값, 변수
    • 표에서의 변수는 열(column)을 의미
  • 독립변수 : 원인
    • 원인 : 결과와 무관하게 발생하는 사건
  • 종속변수 : 결과
    • 결과 : 원인에 종속되어 일어나는 사건
  • 서로 상관이 있는 특성 : 한 쪽의 값이 바뀔 때 다른 값이 바뀌는 것(= 상관관계)
    • 변수 A, B의 변화가 일정하게 나타나고,
    • A-B 관계 외에 다른 영향을 주는 요소가 없을 때,
    • 인과관계에 따라 A에 의해 B가 변화한다면 A는 독립변수, B는 종속변수
    • 모든 인간관계는 상관관계 / 모든 상관관계가 인과관계는 아님

13. 심리전

  • 공부를 그만두고 싶을 때
    • 지금 하고 있는 행위가 경제성이 없다고 생각할 때,
    • 우리 뇌는 1차로 지루함을, 2차로 절망감을 나타낸다.
    • 이러한 경고를 무시하면, 앞으로 비슷한 경험을 겪을 때 거부감을 느끼게 된다.
  • 지루함을 느끼게 되면 과감하게 공부를 유보하자
    • 수동적인 포기가 아닌, 능동적 유보의 전략을 취하자
728x90

+ Recent posts