이 책은 통계학에 나오는 가장 기본적인 정규분포와 표준편차란 용어 없이 통계에 대해서 설명하고 있다. 또한 가장 기본적인 확률과 그것을 판단하는 방법에 대하여 잘 소개하고 있다. 먼저 데이터 수집의 중요성을 강조한다. 통계자료를 분석한다는 것은 전체 중에 일부인 표본 자료를 선택하고 분석함으로써 전체가 어떠하리라는 것을 추측해야 하고 이러한 표본 선정을 포함하여 데이터 수집과정이 매우 중요하다. 데이터를 어떻게 수집하느냐에 따라 조사의 성패가 달려있고 통계학에서는 자료를 잘 수집하여 수치로 잘 만드는 것이 고도의 통계기법을 사용하여 데이터를 분석하는 것보다 중요하다. 그렇다면 이러한 표본을 선정하는 방법은 대상을 원칙과 표준에 따라서 관측하여 일관성 있게 데이터를 수집해야 한다. 우리는 표본을 선정하고 여기에서 수집된 자료만 분석한다. 하지만 우리가 수집과 분석 과정에서 파악하고자 하는 내용은 모집단이기에 이를 잘 대표할 수 있는 표본을 선정하는 것은 중요한 문제다. 목적은 두루뭉술하게 설정해야 하고 목표는 구체적으로 설정해야 한다. 구체적인 목표를 설정하지 못한다는 것은 과제의 필요성과 효과에 대해서 파악하지 못한 것과 같다. 사실을 파악하기 위해서는 계량화하여 숫자로 표현하는 것이다. 우리가 자료를 얻는 3가지 방법에는 관측, 조사, 실험이 있다. 현상은 측정이라는 과정을 거친 후에 자료의 형태를 가지게 된다. 같은 대상을 관찰하더라도 다른 측정 방식을 사용한다면 다른 값을 가지는 수치 획득이 가능하고 같은 방식이어도 측정할 때마다 서로 다른 값이 측정된다면 신뢰성이 떨어진다. 그래서 측정의 신뢰성을 얻기 위해서는 측정 조건에 대한 기준의 정립이 필요하다. 측정 표준을 정하는 이유는 측정하는 대상들에 대해서 동일한 조건을 만들어 주기 위함이다. 또한 동일한 대상에 대해 동일한 내용을 측정할 때 같은 수치가 나오도록 하려면 측정의 조건을 같게 해야 한다. 객관성을 위해 조건을 같게 하는 방법을 정리한 것을 측정 표준이라고 하는 것이다. 표준이 지켜지지 않은 상태에서 얻은 수치는 의미가 없고 이에 근거한 의사결정 또한 가치가 떨어진다고 볼 수 있다. 측정과 평가에는 평가자의 주관적 감정이나 상태, 조건, 평가자들 사이의 방법 차이 등 여러 가지 요소가 복합적으로 적용된다. 이러한 상황에서 평가의 객관성을 담보하는 것이 측정 결과의 신뢰성을 위해서 매우 중요하다. 같은 자료를 보고도 서로 다른 주장을 펴는 사람들은 자신들이 보고자 하는 것만 보는 경향이 있기 때문이다. 짧은 시간과 내용에 중요사항을 말해야 한다면 대푯값을 사용할 수밖에 없으며 그럴 경우는 평균이 가장 우수하다. 처음 자료를 보았을 때는 먼저 그래프를 통하여 전체의 분포를 살펴보는 것이 효율적이다. 특히 처음 자료를 수집한 경우에는 전체 자료에 대해 히스토그램, 상자 그림이라는 그림을 통해서 자료의 전체적인 모양을 먼저 보면 유용하다. 여기서 히스토그램은 자료를 동일한 범위에 따라 구분하고 각 범위에 속한 자료의 수를 높이로 나타낸다. 상자 그림은 히스토그램을 왼쪽으로 90도 회전한 것으로 볼 수 있다. 우리는 통계자료를 기본적으로 평균으로 표현하고 그래서 자료의 평균 계산 원리에 대해 이해가 필요하며 평균도 잘못 활용되면 오해를 불러일으킬 수 있다. 통계에서 중요한 것 중 하나인 세분화는 파악하고자 하는 대상을 잘게 나누어 보는 것이다. 우리는 대상을 잘게 나누어 볼 때 좀 더 자세한 정보를 얻을 수 있고 전반적으로 설득력 있는 논거 제작이 가능하다. 우리는 적절한 범주를 이용하여 자료를 세분화하여 보아야 하는데 이를 나타내는 예로 데이터가 있다. 데이터는 각자 구성 요소들이 있고 이 구성 요소들을 성격이나 특징에 따라 적절히 나누어 파악하면 전체를 좀 더 합리적이면서도 잘 파악할 수 있다. 이 책을 읽고 나서 느낀 점은 확실히 이 책은 어려운 내용이라고 느꼈다. 알아듣지 못하겠는 부분이 많았으며 용어 자체도 어려웠다. 하지만 통계학이라는 학문에 대해 알아볼 수 있었고 통계학 안에서의 내용을 배울 수 있던 것은 좋았다. 또 단 한 가지라도 지식을 얻는다는 것이 기뻤다.