2018-01-01から1年間の記事一覧
概要 普段iMacで分析をやることもあれば、ラップトップのMac Book Airで分析をやったりすることもあり、 お互いの環境が一致せずに気持ち悪さを感じる事があるのもあり、ついにDockerに手を出してみました。 今回はDockerでCentOS6にRとRStudio Serverが入っ…
概要 JuliaにはSundials.jlという微分方程式の数値計算のためのライブラリがあります。 qiita.com Sundialsに関しては上のリンクにかかれていますが、 SundialsライブラリはJulia専用ではなく、いろんな言語で使用できて、Matlabでも使うことができる ような…
概要 先日実務で経済学の限界分析の考え方を応用した意思決定サポートツールを作る機会があり、それ以来経済学への興味が出てきましたし、実務における社会科学の概念の活用可能性を強く感じました。 そこで今回は自分の理解を改めて振り返るという気持ちも…
概要 先日Rのパッケージを使ってBayesian Bootstrapをやってみました。 rf00.hatenablog.com 今回はよりBayesian Bootstrapの理解を深めるためjuliaで、パッケージを使わずBayesian Bootstrap的なことをやってみたいと思います。 実験 まずは必要なパッケー…
概要 タイトルの通りjuliaでbayesian probabilistic matrix factorizationができるBPMFというパッケージを公開しました。 github.com インターフェースはpythonのscikit-learn風でとても使いやすくできたかなと個人的には思います。 そこで今回はこのパッケ…
概要 個人的にBayesianなアプローチとMatrix Factorizationに最近興味を持っています。 そんなわけで今のところ以下のように色々と実験してきました。 rf00.hatenablog.com rf00.hatenablog.com rf00.hatenablog.com その流れで今回はBayesianなMatrix Facto…
概要 Juliaはギリシャ文字を使うことができるので、論文の実装等をするときには、変数名を論文の中で使われているギリシャ文字と同じにすることができるため便利です。 入れ方としては、\+ギリシャ文字名を入れてtabキーを押下でギリシャ文字に変換されます…
概要 twitterを見てみたらBayesian Bootstrapなるものが有用ということを知りました。 これもT/Lでは見かけないけど、Bayesian bootstrapはかなりいろいろ役立つよ。Dirichlet分布からデータ重みをsamplingして、その重み上でMAP推定する。これをかき集める…
概要 リブセンスさんの以下記事で実装されている、Bayesian Probabilistic Matrix Factorizationに興味が湧いたので実装してみました。 analytics.livesense.co.jp とはいえ全く同じことをやっても面白くないので、プラスαとしてJuliaで実装しPythonと速度を…
概要 『ベイズ推論による機械学習入門』のChapter3のp105~p114に線形回帰の事後分布の求め方がのっていたので、実際にJuliaで実装し、線形回帰のパラメータを求めてみました。 機械学習スタートアップシリーズ ベイズ推論による機械学習入門 (KS情報科学専門…
概要 Juliaで単回帰、重回帰、ロジスティック回帰を試したのでメモです。 特にモデル自体にはなんの意味もなく、単にjulia上で単回帰、重回帰、ロジスティック回帰のやり方を試すだけの記事です。 実装 今回の全体のコードは以下です。 regression_julia.ipy…
概要 以前以下の記事でPythonによるMatrix Factorizationを行いました。 rf00.hatenablog.com これをJuliaでやってみようと言うのが、今回の記事の趣旨です。 そしてJuliaとPythonでMatrix Factorizationの計算速度も比較したところJuliaが早かったので、 そ…
はじめに 前回は以下記事にてオーソドックスなBias付きのMatrix Factorizationを実装しました。 rf00.hatenablog.com そして今回は以下論文のアプローチによる個々人の順序の間の差の違いを考慮したMatrix Factorizationを実装してみたいと思います。 Collab…
概要 今回はMatrix FactorizationをPythonで実装してみたいと思います。 Bias付きのものとそうでないものを実装して精度を簡単に比較します。 通常のMatrix Factorizationとバイアス付きのMatrix Factorization それではMatrix Factorizationに関して少し具…
概要 今回はPytorchでニューラルネットでの多クラス分類を試してみました。 Pytorchはkerasやchainerに並ぶDeep Learningフレームワークです。特に研究用途でよく使われているようです。 Pytorchに関しては以下の記事が詳しいので是非参考にしてください。 w…
概要 以下のツイートを見かけて、実務でリスティングの関わることをやっているので気になったので、斜め読みしてみました。 オンライン広告のセカンドプライスオークションが単独の買い手に対して行われる場合、売り手の提示する最低入札価格はそのまま希望…
とても良い本を読んだので紹介です。 学びと感謝の中には、 たくさんの小さな言葉が詰まっています。 そんな小さな言葉を、みなさんと分かち合いたくて、 書き出してみたら500にもなりました。 まいにちをよくする500の言葉作者: 松浦弥太郎,ワタナベケンイ…
読んだ論文 今回読んだ論文は以下。 Deep Neural Networks for YouTube Recommendations 間違い等ありましたら、ご指摘お願いいたします。 実務で真似したい点 ランキング候補の生成と実際のランキングスコアの算出をモデルを分けて実施している点 概要 YouT…
概要 今回はRのgretaパッケージを使ったベイズモデリングを紹介します。 公式サイトは以下。 https://greta-dev.github.io/greta/index.html 公式のサンプルコードは以下にのっています。 Get started with greta gretaとは gretaパッケージはどんなパッケー…
読んだ論文 今回読んだ論文は以下 www.kdd.org 間違い等ありましたらご指摘お願いいたします。 注目した部分 最適化と予測モデルの組み合わせのアプローチ 概要 LinkedInにおけるemailの送信量の最適化の方法の説明。 LinkedInでは様々なメールが配信されて…
読んだ論文 今回読んだ論文は以下 research.fb.com 間違い等ありましたらご指摘お願いいたします。 注目した部分 cnnを利用して埋め込み特徴量を作成している userとeventをjointし重みを学習することでuserとeventを同じ潜在空間上に射影し、それを特徴量に…
概要 前回Kerasでトレンドのある時系列データの予測を試みましたが、あまりうまくいきませんでした。 特に以下の2つの課題があったと思います。 時刻を経るごとに大きくなる動きを捉えられておらず、他の簡単な手法に精度が劣っていた 予測の予測による結果…
概要 最近ではKaggleの上位陣もRNNでの予測でいい結果を出しているという噂を聞いて興味があり、KerasにてRNNを利用した時系列の予測を行ってみました。 結論としてはそこまで望ましい精度は出なかったのですが(自分のやり方の問題の可能性あり)、取り組み…
概要 GCPを活用して、kaggleに参加したいので、command lineからデータをダウンロードしたいと考えていたら、パッケージがあったのでインストールする。 参考したのは以下そのまま。 Kaggle: Your Home for Data Science GitHub - floydwch/kaggle-cli: An u…
概要 前回構築したGCPのデータ分析環境にJupyter等を入れてブラウザでアクセス出来るようにし、分析を実行できる環境を構築する方法のメモです。 rf00.hatenablog.com Anacondaのインストールと、ファイヤーウォールの設定のみで簡単に可能です。
概要 Google Cloud Engine上にデータ分析のためのインスタンスを作成した際の方法のメモです。