夏休みRシリーズの二日目(いつまで続くやら)
昨日からの進歩はあまりなく、plot関数に依るデータの表現や、相関関係、ablineによる表示などを学習。
いろいろ使っていくと、NAのデータがあると解析が止まったりするので、やはり基礎データのクレンジングが如何に大切であるかということを身を持って知る。
つまり、前処理として、データの整形をしてPCで扱い易くするだけではなく、データ上の異例値の排除をしなければならない。この処理には判断が伴う。特に外れ値については、分析上は外したほうが扱いやすいが、外すことに依る影響も考えておかねばならない。