標準入力の数値列から統計量(総和とか平均とか分散とか)を計算するコマンドaccを作った

問:カレントディレクトリより下の階層にある全ての.cppファイルの平均サイズをバイト単位で求めよ

解答例(こういうのあまり得意ではないのでヘンかもしれませんw許してくださいw):

% du -ab | grep "\.cpp\$" | grep -o "^[0-9]\+" | acc --mean -f "%.0f"

研究の仮のデータ集計とかにこういうUNIXライクな小さいプログラム,欲しかったけどありそうでなかったので書きました.
accコマンドと名付け,githubに公開しています.

https://github.com/sakanazensen/acc_command

入力は数値がずらずらとstdinにやってくればOK.double型の範囲を超えないように.
現時点では,総和,最小値,最大値,平均値,分散,中央値の出力ができるようになっています.
中ではboost::accumulatorに計算を丸なげしてるだけです.
よって,boost::accumulatorにない項目(最瀕値や標準偏差)には当面対応できません.
計算量等の問題についてはboost::accumulatorのマニュアルを参照してください.

当然無保証です.MITライセンスとします.
本記事コメントで対応はする考えはあります.pull requestがあれば反応するかもしれません.

実装に対するツッコミもあったら嬉しいかも.
あまり自分のコードを人に見せたことがなくてよくない.

「論文の書き方」

産総研 中田先生より.
やればできる 卒業論文の書き方

ちょうど大学院来て最初の論文執筆を始めたところなので,大いに参考になりそう.
というか多くの話は別に卒論に限ったことではないですね.

  • 「結論表」の話,こんなふうにちゃんとまとめて自分の研究を見返したことって,ハッキリ言って全くなかった.今まで何してたんだろう.
  • 「速く書く」話,よく聞く話もあるけど,ここまで具体的な指針に触れたのは初めて.ぜひこれでやってみたい.
  • いい論文とは,ダメな論文とは.耳が痛いよぅ><
  • 「金出先生流の推敲」言われてみれば当然なのに,実践できてないなぁ…

もっと詳しく知りたい方は,理系のための「即効!」卒業論文術―この通りに書けば卒論ができあがるを.
僕も読んでみたいです.

#はてブでやればいいのに的なブログ記事を連発してますね

研究者が知らなくてはいけない事や心構え

慶應・武藤研究室の直江さん(現在助教だそうです)より
情報系の研究者が研究・論文執筆をする際に知らなくてはならない事や心構え
(PDFです)

本文13ページの短い資料ですが,すごく納得できたり,耳が痛かったり.

耳が痛かった主な点

  • サーベイしろ

    • 学部んときのサーベイのしなささは異常でした
    • 何もないところからアイデアは出ません
    • 成果を出すために必要
    • 主体的に研究するために必要
  • CFP(Call for Paper)に注意しろ

    • そもそも自分の分野にどういう学会があるか十分把握してなかった
    • 聞いたことあっても何がトップ会議か知らなかったり

      • impact factorとか調べたこともない
    • 成果を出すために必要
    • 主体的に研究するために必要