Septeni Engineer's Blog

セプテーニエンジニアが綴る技術ブログ

Spark

素早くデータマイニングしたくなったらSparkを始めよう

こんにちは。菅野です。 Scalaを使って集計バッチなどを書くと、ふつうは以下のようにコレクションのメソッドを駆使してデータをこねくり回しますよね? val 何かのデータ: Seq[String] = ??? 何かのデータ .groupBy(identity) .mapValues(_.size) .toSeq .s…