IPython Notebook 5 ( Jupyter notebook )で インデント スペース 数を4つから2つ変更した

IPython Notebook 5.4.1での、インデントの変更方法。 ~/.jupyter/nbconfigに以下の2つのファイルをおけばインデント2つに変更できた。 edit.json: { "Editor": { "codemirror_options": { "indentUnit": 2, "vimMode": false, "keyMap": "default" } } } no…

Rubymine と dockerを 連携して デバッグ できるようにしてみた

Railsのプロジェクトにいくつか関わっているとRMagicとかのネイティブインストールするライブラリのバージョンに違いが出てきたりして、動かずハマるということがしばしばある。 そろそろ開発環境をプロジェクト毎に分けたいなー、と思い始めてきたのでDocke…

【Mac OS】巨大なデータをpickleで読み書きしたときにはまったこと

あまりデータサイズが大きくない訓練データセットを読み込む時は普通にpandasのread_csvを使って import pandas as pd df = pd.read_csv('train.csv') で大丈夫だけど、pandasのread_csvは遅いので、データサイズが大きい時は他の方法を使いたくなる。 (実…

いまさらNBSVMを調べてみた

kaggleをやっていてテキスト分類のコンペのkernelでNBSVMが使われていたので、勉強のために今更ながらNBSVMに関して調べてみた。 NBSVMはテキストデータのトピック分類や感情分類で比較的に精度が良いことを確認されているアルゴリズムで、このようなジャン…

TfidfVectorizerのよく使いそうなオプションまとめ

TfidfVectorizerとは 文章内に出現する単語の出現頻度と希少性を掛け合わせた値Tfidfを算出するアルゴリズム。文章を特徴づける単語を探したりできる。 例えば、Twitterの投稿テキストを読み込んで、気分が「Happy」か「Unhappy」かを判別する機械学習モデル…

Rails5.1.0.beta1 System Testを試してみた

先日、Rails5.1.0.beta1のリリースでSystem Testが導入されたので試してみました。 weblog.rubyonrails.org システムテストとは? システムテストは、ブラウザの中でアプリケーションのテスト実行が可能なテスト。 実際のブラウザ体験をテストすることで、Ja…