pysparkでFitbitの歩数JSONをパースして週平均歩数（月〜日）を求めてみた

Spark Python

以下の記事にコメントがついており、週平均歩数はどうやって求めるのか？ということだったのでやってみた。検証環境 # Dockerイメージで実行（rootユーザで実行するため、「--user 0」を付与） # 参考：https://stackoverflow.com/questions/75560836/apach…

2021-05-26

EMR(Spark)のログレベルをクラスタ作成時に設定したい

AWS Sed ShellScript Spark Linux EMR

特に何も設定せずにEMRのSparkを使うと、ログレベルがINFOなので、とにかくいっぱいログが出ます。そのため、ログレベルを変更しようと思ったわけですが、クラスタ作成時に設定しておきたいなと思ったのでやってみたメモです。検証環境案1 ブートストラッ…

2021-01-22

pysparkでFitbitの睡眠JSONをパースして平日と休日の平均睡眠時間を求めてみた

Python Spark

pysparkでFitbitの歩数JSONをパースして、平日と休日の平均歩数を求めてみました。↓PySparkで歩数JSONを平日・休日別に集計 ↓Pythonでの睡眠時間比較確認環境コード実行結果例 2019年、2020年の月別、平日・休日別平均睡眠時間参考にしました

2021-01-20

DockerでPySparkとJupyterNotebook環境を利用する

Docker Powershell Windows Spark Python

PySparkとJupyterNotebookが使えるDockerコンテナがあったので使ってみました。すぐに使い始めることができるので、Dockerのありがたみを感じます。 EMRを使う前にスクリプトの動確できる環境が欲しかったので助かっています。確認環境コマンド (おまけ) P…

2021-01-18

pysparkでFitbitの歩数JSONをパースして平日と休日の平均歩数を求めてみた

Python Spark

pysparkでFitbitの歩数JSONをパースして、平日と休日の平均歩数を求めてみました。pysparkでの歩数JSONのパース↓ pythonでの歩数比較↓ www.k-hitorigoto.online 確認環境コード実行結果例 2019年、2020年の月別、平日・休日別平均歩数参考にしました