선량한 차별주의자 (김지혜)
<br>
<br> 차별이란 무엇인가? 이 책을 읽으면서 했던 가장 큰 생각이였다. 차별은 우리 사회에서 어디에나 존재하지만, 이런 차별주의자가 선량한 차별주의자로 바뀌어야 한다고 고민했다. 차별에 대해 우리가 생각하는 것에 대해 좀 더 많은 질문을 던지고 있는 책이였다.
<br>
<br> 실제 대한민국에서도 여러 차별주의적 이론들이 많이 강화되고 있다. 문재인 대통령 찬성,반대냐? 노키즈존 찬성, 반대냐?. 중국인 입국 찬성, 반대냐 등과 같은 차별주의자들은 세상을 약간 이등분적 시각으로 얘기하는 것처럼 보인다. 그러나 지금 와서 차별주의가 존재 해야하냐, 말아야 하냐에 대해 구분하는 것은 옳지 않다고 본다. 왜냐하면 우리가 지금 사회를 살아갈 때, 이분법적으로 사회를 바라보는 사람들을 비난하고, 융통성 없는 사람들이 세상을 뒤 덮고 있다 생각하고, 실제 사람들은 이런 이분법적 사고에 너무나 익숙해져 있다. 그러나 우리가 지금 살아가는 이 세상은, 단순히 이분법적 사고로 세상을 나누고 있지 않다.
<br>
<br> 차별은 공정함이 될 수 없다. 모든 사람들이 한몸으로 하고 생각하고 있는 내용일 것이다. 이 책은 우리가 차별을 보지 못하는, ‘선량한 차별주의자’가 되는 이유를 1부에서 중점적으로 다루고, 2부에서는 다양한 사례를 통해 차별이 지워지거나 ‘공정함’으로 둔갑되는 메커니즘을 살핀다. 차별은 사실 어떤 메카니즘을 통해서라도 공정함으로 둔갑될 순 없다. 우리는 실제 사회에서 수 많은 차별을 본다, 그러나 그런 사회에서 적응하고, 단순히 생각만 하는 우리나라는 사회에서 차별은 선량한 차별이 될 수 없다 생각한다. 다시 우린 사회에 대해 생각해 봐야 할 때가 되었다.
<br>
<br>구글은 빅데이터를 어떻게 활용했는가 (벤 웨이버)
<br>
<br> 구글은 빅데이터를 매우 잘 활용하는 기업 중 하나이다. 구글 홈, 구글 워치, 픽셀 폰, 크롬 등을 통해 최신 프로그램으로 다양한 빅데이터를 수집하고, IOT를 통해 다양한 데이터를 공유하면서 구글과 같은 기업들이 어떻게 데이터를 공유하고 생각할 수 있는 방법들에 대해 많이 탐구하고 있다.
<br>
<br> 이 책들 중 가장 잘 알았던 내용은 바로 오클랜드 20연승에 관한 이야기이다. 기존에 수학을 품은 야구공 독후감에서도 언급했고, 다양한 보고서 속에서도 언급했듯이 스포츠와 빅데이터의 결합 시작점은 오클랜드 애슬레틱스다. 이젠 오클랜드 말고 다른 얘기를 해보자. 이 책 중 가장 인상깊던 챕터인 CHAPTER 7의 경우 구글이 어떻게 최고의 기업이 되었는지 설명하고 있다. 구글은 IOT 데이터를 공개하고 활용하면서 다양한 활용성을 갖고 있다. 그러나 이베이는 스카이프를 왜 인수했나는 주제는 흥미롭게 다가왔다.
<br>
<br> 이 책을 보며 처음 안 사실이지만, 다중 통화를 위해 이용되는 스카이프가 처음으로 이베이에 의해 합성된 것을 처음으로 알았다. (물론 이베이는 구글과 1도 관련이 없다.) 현재 이베이는 이베이 기반인 온라인 마켓플레이스, 페이팔, 키지지, shoppong.com을 운영중이였다. 비즈니스 모델이 C2C, B2C형태로 진행되면서 수익 구조가 온라인 마켓 플레이스를 제공하고 이에 대한 수수료를 받는 형태이다. 그러나 이외에도 페이팔 수익, 판매자의 부가서비스 사용료, 광고수익 등을 통해 수익을 확보하고 있었다.
<br>
<br> 이베이 분석 플랫폼은 현재 전 세계 압도적인 플랫폼이였지만, 당시에는 그러지 모했고, 스카이프를 통해 다양한 수익모델을 창출하고자 인수를 진행했었다. 그러나 현재 우리가 알고 있는 결과와 같이 스카이프는 다양한 수익 창출원이 부족했고, 결국 이를 매각하게 된다. 다양한 데이터를 기반으로 한 기업 성장이 필요하고, 이를 진행했지만. 이런 매각 과정에서 빅데이터가 활용되는 것을 이제 알게 되었고, 더 다른 시점으로 빅데이터의 기업 경영 활용에 대해 다양한 시각을 가지게 해 준 좋은 책이였다.
<br>
<br>빅데이터, 4차 산업혁명의 언어 (바나드 마)
<br>
<br> 이 책은 기존에 내가 읽었던 여러 데이터 분석 도서와 마찬가지로 정말 다양한 기업들의 활용 방법을 통해 빅데이터의 활용 방식에 대해 얘기하고 있다. 빅데이터 분석으로 유명한 월마트, 넷플릭스, 셀, 페이스북부터 스코틀랜드왕립은행, 롤스로이스, 아픽시오, 로터스 F1팀, 미국 연방정부 등 총 45가지의 사례를 들고 있었다.
<br>
<br> 특히 나는 이 중 로터스 F1팀과 BBC에 대해 많은 주목을 했었다. 사실 어릴적부터 모터스포츠에 대한 큰 흥미가 있었고, 해당 트랙을 모두 선을 따서 주행 경로를 작성하는 등 모터스포츠에서 많은 변화가 가능하다고 생각했다. 그런데 로터스 F1의 데이터 분석은 내게 마치 신세계와 같은 내용이였다. F1대회에서 주행 중인 자동차에 200개 이상의 센서를 통해 운행 형태와 속도 등 다양한 데이터를 수집했고, 한바퀴를 달릴 때 마다 25MB의 자료가 생산되는 것을 알 수 있었다. 심지어 풍동실험 데이터까지 활용하고 ERM기반 V블록을 통해 연료 소모량, 랩타임까지 줄이는 것에 많은 흥미를 갖게 되었다. 이 내용을 읽고, ‘오히려 랠리카에서는 활용이 안될까?’라는 의문을 갖고 더 알아보고싶은 생각을 갖게 되었다.
<br>
<br> BBC는 데이터 저널리즘의 헉신적 기업 중 하나다. 어떤 사람이 5분 동안 어떤 뉴스 웹사이트를 방문했다고 가정하자. 여기에서 수백 개의 데이터가 생성된다. 검색창에 기사를 검색하고, 댓글을 등록하는 등 사용자의 의도가 담긴 작업 이외에도, 사용자가 어떤 기사에서 몇 초 동안 머물렀는지, 어떤 분야의 기사를 연속해서 읽었는지 모두 빅데이터가 되기 때문에 언론에서의 데이터는 매우 중요하다. 지금까지 대한민국 언론들은 모두 데이터와 저널리즘을 접목시킨 발전을 요했다면, BBC는 이런 머슨 데이터를 활용한 웹 시스템 개선 등 기존의 데이터 저널리즘과 완전히 다른 패러다임으로 인해 많은 놀라움을 나타낼 수 밖에 없었다.
<br>
<br> 이 책은 다른 책들과 달리 자세하고, 여러 세부적인 데이터 분석 사례와 프로세스를 다뤄 더 흥미로운 데이터 분석 관련 기업 책이였고, 모터스포츠와 저널리즘 등에 대해 많은 흥미를 갖게 되었다.
<br>
<br>90년대생이 온다 (임홍택)
<br>
<br> 90년생들이 대한민국에서는 어떤 세대인가? 흔히 X세대의 다음 세대라 불리면서 N포세대라는 말이 본격적으로 작용되기 시작한 세대이다. 지금 90년생들에게 최고의 직장은 공무원이고, 90년생들이 보는 대한민국 사회는 지옥과 같은 상황이다. 90년생들이 맞이했던 입시는 자기소개서와 학종의 시작이였고, 그들이 사회로 나간 직후, 우리나라는 우리 손으로 우리가 뽑은 대통령을 쫓아냈으며, 그 어느 세대보다 SNS를 처음 접하면서 사회적 발전을 해 나아가는 세대일 것이다. 우린 얼마나 그들에 대해 알고 있는가?, 그들이 뭐라고 생각하는 것인지 우리는 알고 있는 것일까?
<br>
<br> 90년생들은 사회에서 바라보기에 “처음으로 기성세력에 대해 큰 반기를 드는 세대”이다. 지금 우리가 흔히 말하는 정치에서는 386 세대가 아직까지도 정치의 기성세대이지만, 90년대생에게 들어서면서 점차 이런 심리는 변하고 있다. 90년생들은 기존의 체계에 반대하고, 윗사람들이 보기에 반항하는 생각과 식견을 갖고 있다. 그러나 그들의 반항은 사회가 만들어낸 것이 아닐까? 지금 그 어느 기간동안 이런 종류의 책이 나왔던 사례가 없다는 것을 감안하면 확실히 이들이 기존의 세대와 다르다는 것이다.
<br>
<br> 그러면 90년생들의 가장 큰 특징은 무엇일까? 내가 보기에는 바로 솔직함이다. 그들은 말하는 것에 거침이 없다. 그 어느 상황에서도 누군가에게 복종하지 않으며, 자신의 생각을 솔직히 표현하고, 유튜브나 SNS를 통해서 자신들이 원하는 것, 보고싶은 것에 좋아요를 누르고, 구독을 누르고, 그 내용이 전체 공개되는 것에 큰 거부감을 받지 않는 세대로서, 스스로의 취향을 공개하고, 이에 거침이 없는 세대이다. 우리는 다시 이런 세대에 대해 생각해야 한다. 과연 지금의 사회가 이 90년생들이 성장해 나아갈 수 있는 세대인지, 그리고 00년생들의 차이점은 무엇일지.
<br>
<br>이것이 빅데이터 기업이다 (함유근)
<br>
<br> 빅데이터는 이제 많은 기업들의 필수적인 필요 요소가 되었다. 많은 기업들은 데이터 수집 및 확보에 애를 쓰고 있고, 자체적인 데이터 센터를 통해 자주적인 데이터 분석과 활용을 위해 노력하고 있다. 이들 중 이 책에서는 빅데이터 비즈니스 모델은 비즈니스멘, 데이터 창출차, 데이터 대리인, 데이터 연구가, 빅데이터 응용가들이 이런 일을 하고 있다.
<br>
<br> 해당 책들은 루미나, 동일본, ntt, 아마존, 디즈니, 데이터 시프트, 히타치 글로벨센테, 판도라, 스포티파이, 애플tv를 사례로 설명했다. 이 책에서 난 내 진로인 데이터 연구가의 내용에 많은 관심을 가졌고, 이 책 외에도 다른 방법으로 활용된 사례들에 대해 찾아보다 왓챠라는 플랫폼에 대해 알게 되었다. 왓챠는 대한민국의 VOD 서비스 웹사이트 및 앱인데, 해당 시스템은 추천 알고리즘에 대해 데이터 분석 및 활용을 통해 왓챠 대표 자신들도 빅데이터 기업이라 소개할 정도로 빅데이터 기업으로 변모하고 있다.
<br>
<br> 해당 책에서 나왔던 스포티파이는 기존 음악시장의 음원 위주 비즈니스 모델을 단숨에 변화시키는 모델을 제시한 상업적 음악 스트리밍 서비스이다. 애플의 iTunes나 Google play, 아마존 뮤직 등 경쟁서비스는 음원을 한곡 또는 앨범으로 구입해서 저장하여 두고 이용하는 서비스였지만, 스포티파이의 음악 스트리밍 서비스는 메이저 음반사에서 라이선스한 음악을 서비기반 스트리밍과 리스너들간의 P2P 기술을 조합하여 곡 파일을 인터넷을 통해서 제공한다. 이런 빅데이터 분석이 기업의 가치를 바꾼다는 것을 이 책을 통해 알게되었고, 현재 작성하고있는 빅데이터 기업 분석 리포트에 많은 도움을 받을 수 있었다. 대학 재학 중에서 이런 기업 분석에 대해 더 자세한 활동을 진행해 보고 싶은 또 다른 동기도 만들어지게 되었다.
<br>
<br>세상을 읽는 새로운 언어, 빅데이터 (조성준)
<br>
<br> 이 책은 사실 이 저자 교수님을 대회에 나가서 직접 소개받은 책이다. 서울대 교수님이시고, 학생들을 위해 빅데이터 관련 강의를 해 주시는 교수님이다. 내가 여기서 강조하고, 인상깊게 읽은 내용은 3부의 1번인 애널리틱스, 데이터를 분석하다와 4부 2번인 우리에게는 빅데이터를 이해하는 리더가 필요하다이다.
<br>
<br> 우리는 애널리틱스를 많이 양성하지 않았다. 데이터 사이언스 플랫폼이 성장하고, 우리가 다양한 데이터 프로세스를 갖췄음에도, 전혀 데이터를 잘 다루지 못하는 상위 경영진 때문에 데이터를 아무런 활용도 하지 못하고 그저 용량만 잡아먹는 문서 취급하면서 버려지는 환경이 너무나 아쉽고, 교수님과의 인터뷰에서도 이 점을 많이 염려하고 게셨다. 데이터 애널리틱스를 성장시키고 발전시키기 위해서는 교육의 역할, 그리고 우리가 많이 현재 대회를 통해 기르는 데이터 분석을 위한 시각을 강조하면서 공공데이터를 통해 많은 사회문제를 확인해 보라고 조언해주셨다.
<br>
<br> 4부 2번은 빅데이터를 이해하는 리더가 필요하다 얘기하는데, 이것은 위 내용과도 연관된다. 아무리 밑 팀에서 데이터 분석을 해서 결과를 내더라도 위 상위 경영진들이 이런 내용에 대해 전혀 알지 못하고 분석할 의지조차 없게 된다면 이는 빅데이터 기업으로 성장하기 위한 큰 장애물이 될 것이다. 교수님 또한 우리가 앞으로 교육을 통해 경영진들에게 데이터 분석에 대해 명확히 가르치면서 판단을 할 수 있는 경영진 육성이 필요하다 말씀하셨다.
<br>
<br> 이 책은 교수님과의 인터뷰 과정에서 추천받은 책이였지만, 해당 책은 꼭 한번 읽어볼 가치가 있다고 생각하고, 좋은 책을 소개시켜주신 조성준 교수님께 감사를 표한다.
<br>
<br>플라톤 국가-서울대 선정 인문고전 50선(손영운)
<br>
<br> 사실 원래 플라톤의 국가 강의라는 책을 통해 처음으로 플라톤 국가에 대해 접했지만. 내용 자체를 이해하기 어려웠다. 너무 이해하기 어렵기보다는 정확한 이론 확립이 없어서 여러 철학 이론을 공부해야 했기에 내용이 복잡해져 읽기 힘들었었다. 그러나 이 책을 통해 소크라테스와 플라톤, 소피스트, 파레토, 칠인 통치 등에 대해 알고, 국민을 위한 민주주의 등에 대해 알면서 더 많은 고민을 하게 되었다.
<br>
<br> 특히 여기서 고민한 것은 올바른 국가, 국민을 위한 민주주의에 관한 내용이였다. 대한민국은 현재 대의민주주의 체재로서 플라톤 국가에서 나타났던 내용과 상반되는 내용이 어느 정도 있지만, 국민을 통한 민주주의에 대해 심각하게 고민해봐야 할 내용이다. 현재 대한민국은 전혀 국민을 대신할 수 없는 민주주의와 국회 정당 시스텀을 갖추고 있다. 지금 우리나라는 심각한 편향적 정치민주주의를 시행하고 있고, 표의 가치가 제대로 인정되지 못하고 있는 대의 민주제를 채택하면서 사회적 불평등에 대해 많은 불만을 가질 수 밖에 없는 구조가 형성되고 있다.
<br>
<br> 대의민주제는 사회적으로 피할 수 없는 사항이다. 진지하게 대의민주제는 변화가 필요하다. 진정으로 국민을 위한 민주주의의 진행과 다양한 생각들이 공유되고 이가 직접적으로 정치적 행동으로 이어지는 민주주의를 위해선 우리가 많이 생각을 바꾸고, 민주주의에 대한 고위급 정치자들이 플라톤의 국가를 통해 많이 생각해 봤으면 한다.
<br>
<br>알고리즘 도감 (이사다 모리테루)
<br>
<br> 이 책은 사실 데이터 사이언스 미션을 진행할 때 어느 정도 모델링을 위해서 봤었던 책이였다. 그러나 이 중 알고리즘과 클러스터링, 여러 알고리즘에서 많은 재밌는 점을 찾게 되었고, 더 깊게 읽게 되었다. 이 중 주요 읽었던 내용은 클러스트링인데 클러스터링은 먼저 비슷한 개체끼리 한 그룹으로, 다른 개체는 다른 그룹으로 묶어보자는 내용이다. 클러스터링은 정답이 없는 비지도학습 이다. 다시 말해 각 개체의 그룹 정보 없이 비슷한 개체끼리 묶어보는 내용인 것이다. 반면 분류는 정답이 있는 지도학습이다. 분류 과제를 수행할 때 데이터의 독립변수(X)로 종속변수(Y)를 예측하도록 학습을 진행하게 된다. 클러스터링 과업은 정답이 없기 때문에, 일반적 머신러닝 일고리즘처럼 단순정확도로 평가할 수 없다. 그러나 군집타당성 지표는 군집간 거리, 지름, 분산 등을 통해 평가가 가능했고, 이를 실제로 다양한 수학적 내용을 통해 많이 분석했다. 해당 이론에 대해 공부하기 위해 실제 다양하고 이상적인 알고리즘들을 많이 공부할 수 있었다.
<br>
<br> ?또한 그래프 탐색을 통해 많은 내용을 알 수 있었는데, 다익스트라 알고리즘이 최단경로와 관련이 있어서 실제 알고리즘에 대해 분석할 수 있었고, 알고리즘을 분석하면서 다익스트라 알고리즘의 다른 활용상안에 대해 고민했다.