- 데이터 분석에 관심이 생겨 T아카데미, 오픈랩 등 대외활동을 통해 데이터 분석 대회에 몇가지 참가하게 되었는데, 항상 대회 초입에 들어갔을 때 가장 큰 문제가 분석 시작을 어떻게 해야하는가?에 대한 문제였다.
- 그 원인으로는 첫번째로는 도메인 지식의 부족(금융데이터를 분석하는데 이평선을 모른다면?)이 있을 것이다. 이 부분에 대해서는 보통 모르는 용어를 찾아보는 정도로 진입장벽을 넘어서는 것은 가능할 것이라고 본다. 그 이상의 심도 있느 분석에는 그만큼의 지식이 더 필요하겠지만...
- 두번째로는 데이터를 어떻게 다루어야 할 지를 모른다는 것이다. 데이터 분석이라는 분야에서는 이 문제가 가장 크게 작용할 것이라고 생각한다. 단순히 Pandas, Numpy를 쓸 줄 모른다는 문제가 아니다. 빈 데이터를 어떻게 처리해야 할지, 데이터 분포의 추세나 반복이 어떠한 의미를 갖게 될지 등을 해석하는 문제라고 할 수 있겠다.
- 특히나 이 부분에서 통계적 지식은 데이터를 다루는 데 빛을 발하게 해주는 요소라고 할 수 있겠다. 데이터 시각화를 통해 missing value나 데이터 추세만 보던 분석법에 멈추지 않고, 상관계수나 데이터 분포, 편차 등을 분석할 수 있다면 모델 정확도에도 긍정적 영향을 주지만, 일정한 추세를 알아내는 데 도움을 주어 머신러닝의 중요점 중 하나인 일반화된 모델을 구성하는데에도 많은 도움이 될 것이라고 생각한다. 각 통계분석 기법들을 도표 위에 표현하는 연습을 해본다면 시각화 연습은 덤으로 챙겨갈 수 있지 않을까?
어쩌다 같은 책을 두번째 리뷰하게 되었다. 어플리케이션 쪽으로 졸업작품을 만들게 되었는데, 생각보다 시행착오가 많은 편이다. 그래도 이 책으로 어느 정도 지식을 챙긴 점이 많은 도움이 되어주었다고 생각한다.
개인적으로는 코틀린은 쉽지만, 안드로이드는 어려운 분야라고 생각한다 ㅜㅜ... UI쪽으로 간단한 어플을 만드는거라면 모르겠지만, 통신, NFC, 블루투스 등 하드웨어에 얽히기 시작하면 생각처럼 만드는게 굉장히 까다로워지는 것 같다. 그래서 앱인벤터같은 툴이 인기를 끄는걸까?
안드로이드 공식 언어로 코틀린이 추가된 점은 좋지만, 아무래도 자바 대비 구글링 가능한 코드의 수가 적다는게 아직도 체감이 되는 것 같은 점은 좀 아쉽다. 안드로이드를 처음 접하게 된다면, 그리고 앱 로직이 복잡해질 것 같다 싶다면 자바와 코틀린 두 가지를 겸비하는 것이 조금 더 수월할 수 있을 것이라고 생각한다. 두 언어가 호환이 된다는 점은 생각보다 큰 장점으로 다가오는 것 같다.
다양한 언어를 접해보고 싶어 이번 리뷰 도서로는 C# 도서가 있길래 이 도서로 정했다. 대체로 한빛의 이것이 ~~다 시리즈는 입문부터 시작해서 기초를 다지는 전반적인 내용을 접하기 좋은 내용을 담고 있다. 대학 전공교재로 잘 쓰이는 열혈 시리즈를 생각하면 이해가 되리라 생각된다.
코드 동작 설명에서 이러한 장점이 특히 잘 두드러진다. 처음 hello, world!를 출력하는 부분에서, 콘솔창을 통해 전달한 매개견수 데이터가 어디를 통해 전달되어 출력되는지까지의 과정을 알려주고 있다. 이렇게 한 코드의 동작도 이해하기 쉽게 보여주는 것이 이 책의 장점이라고 볼 수 있겠다.
단점이라고 할 내용은 못 되지만, C#의 내용 자체가 굉장히 방대하다보니, 기본서임에도 책 두께가 상당한 편이다. 비교를 위해 자바의 장석 도서와 비교해봤는데 요약집을 제하면 얼마나 내용이 많은지 감이 올 듯 하다. 하지만 이는 그만큼 C# 전체의 내용을 부족함 없이 담아냈다고도 할 수 있고, 기본적으로 개발 도서는 자신이 필요한 부분을 취사선택하여 공부하면 되는 만큼 일종의 참고서로 활용한다면 충분히 좋은 선택이 될 것이라고 생각한다.
마크다운을 이용한 타이핑 필기는 편하긴 하지만 개행 등을 잘 못하면 가독성이 극악이 된다는 단점이 있었는데, 이런식으로 PPT 양식으로 만들면 한 칸 내에 정보가 제한되는(?) 효과를 발휘하면서 굉장히 읽기 편한 자료를 만들 수 있었다.
다만 아직 개발중인 건지, 불완전한 모습이 간간히 보이고 있다. 어느 정도는 자동 맞춤을 해주지만, 글이 너무 많아지면 내용이 아예 잘려버린다던가(축소에 한계치가 있는걸까?) PPT 변환을 해봤더니 첫페이지 내용으로만 변환되는 문제도 있었고, 아쉽게도 이미지 파일 역시 첫 페이지만 변환이 가능하다. 어서 기능개선을 통해 불편한 점이 해결되었으면 좋을 듯.