Septeni Engineer's Blog

セプテーニ・オリジナルのエンジニアが綴る技術ブログ

2016-11-02から1日間の記事一覧

素早くデータマイニングしたくなったらSparkを始めよう

こんにちは。菅野です。 Scalaを使って集計バッチなどを書くと、ふつうは以下のようにコレクションのメソッドを駆使してデータをこねくり回しますよね? val 何かのデータ: Seq[String] = ??? 何かのデータ .groupBy(identity) .mapValues(_.size) .toSeq .s…