Deep Karmaning

技術系の話から日常のことまで色々と書きます

2018-01-01から1年間の記事一覧

DockerでCentOS6にRとRStudio Serverが入ったDockerfileを作ってみる

概要 普段iMacで分析をやることもあれば、ラップトップのMac Book Airで分析をやったりすることもあり、 お互いの環境が一致せずに気持ち悪さを感じる事があるのもあり、ついにDockerに手を出してみました。 今回はDockerでCentOS6にRとRStudio Serverが入っ…

JuliaのSundialsライブラリを使ってロトカ・ヴォルテラ方程式の数値計算をしてみた

概要 JuliaにはSundials.jlという微分方程式の数値計算のためのライブラリがあります。 qiita.com Sundialsに関しては上のリンクにかかれていますが、 SundialsライブラリはJulia専用ではなく、いろんな言語で使用できて、Matlabでも使うことができる ような…

限界分析(Marginal Analysis)を応用した意思決定の試み

概要 先日実務で経済学の限界分析の考え方を応用した意思決定サポートツールを作る機会があり、それ以来経済学への興味が出てきましたし、実務における社会科学の概念の活用可能性を強く感じました。 そこで今回は自分の理解を改めて振り返るという気持ちも…

Bayesian Bootstrapをjuliaでやってみる

概要 先日Rのパッケージを使ってBayesian Bootstrapをやってみました。 rf00.hatenablog.com 今回はよりBayesian Bootstrapの理解を深めるためjuliaで、パッケージを使わずBayesian Bootstrap的なことをやってみたいと思います。 実験 まずは必要なパッケー…

【自作パッケージ】BPMFというJuliaでbayesian probabilistic matrix factorizationができるパッケージを公開しました

概要 タイトルの通りjuliaでbayesian probabilistic matrix factorizationができるBPMFというパッケージを公開しました。 github.com インターフェースはpythonのscikit-learn風でとても使いやすくできたかなと個人的には思います。 そこで今回はこのパッケ…

【論文実装】Variational Bayesian Approach to Movie Rating PredictionをJuliaで実装

概要 個人的にBayesianなアプローチとMatrix Factorizationに最近興味を持っています。 そんなわけで今のところ以下のように色々と実験してきました。 rf00.hatenablog.com rf00.hatenablog.com rf00.hatenablog.com その流れで今回はBayesianなMatrix Facto…

Juliaでギリシャ文字を入力するためのメモ

概要 Juliaはギリシャ文字を使うことができるので、論文の実装等をするときには、変数名を論文の中で使われているギリシャ文字と同じにすることができるため便利です。 入れ方としては、\+ギリシャ文字名を入れてtabキーを押下でギリシャ文字に変換されます…

Bayesian Bootstrapを試してみる

概要 twitterを見てみたらBayesian Bootstrapなるものが有用ということを知りました。 これもT/Lでは見かけないけど、Bayesian bootstrapはかなりいろいろ役立つよ。Dirichlet分布からデータ重みをsamplingして、その重み上でMAP推定する。これをかき集める…

Bayesian Probabilistic Matrix FactorizationをJuliaで実装

概要 リブセンスさんの以下記事で実装されている、Bayesian Probabilistic Matrix Factorizationに興味が湧いたので実装してみました。 analytics.livesense.co.jp とはいえ全く同じことをやっても面白くないので、プラスαとしてJuliaで実装しPythonと速度を…

『ベイズ推論による機械学習入門』の線形回帰の例をJuliaで実践

概要 『ベイズ推論による機械学習入門』のChapter3のp105~p114に線形回帰の事後分布の求め方がのっていたので、実際にJuliaで実装し、線形回帰のパラメータを求めてみました。 機械学習スタートアップシリーズ ベイズ推論による機械学習入門 (KS情報科学専門…

Juliaで単回帰、重回帰、ロジスティック回帰を試してみる

概要 Juliaで単回帰、重回帰、ロジスティック回帰を試したのでメモです。 特にモデル自体にはなんの意味もなく、単にjulia上で単回帰、重回帰、ロジスティック回帰のやり方を試すだけの記事です。 実装 今回の全体のコードは以下です。 regression_julia.ipy…

JuliaでMatrix Factorizationを実装してPythonと計算速度の比較をしてみたらJuliaのほうが早かった

概要 以前以下の記事でPythonによるMatrix Factorizationを行いました。 rf00.hatenablog.com これをJuliaでやってみようと言うのが、今回の記事の趣旨です。 そしてJuliaとPythonでMatrix Factorizationの計算速度も比較したところJuliaが早かったので、 そ…

【論文実装】Collaborative Filtering via Additive Ordinal Regression

はじめに 前回は以下記事にてオーソドックスなBias付きのMatrix Factorizationを実装しました。 rf00.hatenablog.com そして今回は以下論文のアプローチによる個々人の順序の間の差の違いを考慮したMatrix Factorizationを実装してみたいと思います。 Collab…

PythonでBias付きのMatrix Factorizationを実装してみる

概要 今回はMatrix FactorizationをPythonで実装してみたいと思います。 Bias付きのものとそうでないものを実装して精度を簡単に比較します。 通常のMatrix Factorizationとバイアス付きのMatrix Factorization それではMatrix Factorizationに関して少し具…

Pytorchでニューラルネットを構築して多クラス分類を試みる

概要 今回はPytorchでニューラルネットでの多クラス分類を試してみました。 Pytorchはkerasやchainerに並ぶDeep Learningフレームワークです。特に研究用途でよく使われているようです。 Pytorchに関しては以下の記事が詳しいので是非参考にしてください。 w…

【論文メモ】Optimal Pricing in Repeated Posted-Price Auctions

概要 以下のツイートを見かけて、実務でリスティングの関わることをやっているので気になったので、斜め読みしてみました。 オンライン広告のセカンドプライスオークションが単独の買い手に対して行われる場合、売り手の提示する最低入札価格はそのまま希望…

【読書】まいにちをよくする500の言葉

とても良い本を読んだので紹介です。 学びと感謝の中には、 たくさんの小さな言葉が詰まっています。 そんな小さな言葉を、みなさんと分かち合いたくて、 書き出してみたら500にもなりました。 まいにちをよくする500の言葉作者: 松浦弥太郎,ワタナベケンイ…

【論文メモ】Deep Neural Networks for YouTube Recommendations

読んだ論文 今回読んだ論文は以下。 Deep Neural Networks for YouTube Recommendations 間違い等ありましたら、ご指摘お願いいたします。 実務で真似したい点 ランキング候補の生成と実際のランキングスコアの算出をモデルを分けて実施している点 概要 YouT…

gretaパッケージを活用したベイズモデリングの紹介

R

概要 今回はRのgretaパッケージを使ったベイズモデリングを紹介します。 公式サイトは以下。 https://greta-dev.github.io/greta/index.html 公式のサンプルコードは以下にのっています。 Get started with greta gretaとは gretaパッケージはどんなパッケー…

【論文メモ】Email Volume Optimization at LinkedIn

読んだ論文 今回読んだ論文は以下 www.kdd.org 間違い等ありましたらご指摘お願いいたします。 注目した部分 最適化と予測モデルの組み合わせのアプローチ 概要 LinkedInにおけるemailの送信量の最適化の方法の説明。 LinkedInでは様々なメールが配信されて…

【論文メモ】Joint User-Entity Representation Learning for Event Recommendation in Social Network

読んだ論文 今回読んだ論文は以下 research.fb.com 間違い等ありましたらご指摘お願いいたします。 注目した部分 cnnを利用して埋め込み特徴量を作成している userとeventをjointし重みを学習することでuserとeventを同じ潜在空間上に射影し、それを特徴量に…

Kerasを使ったRNNによる時系列データ予測の試み-その2

概要 前回Kerasでトレンドのある時系列データの予測を試みましたが、あまりうまくいきませんでした。 特に以下の2つの課題があったと思います。 時刻を経るごとに大きくなる動きを捉えられておらず、他の簡単な手法に精度が劣っていた 予測の予測による結果…

Kerasを使ったRNNによる時系列データ予測の試み

概要 最近ではKaggleの上位陣もRNNでの予測でいい結果を出しているという噂を聞いて興味があり、KerasにてRNNを利用した時系列の予測を行ってみました。 結論としてはそこまで望ましい精度は出なかったのですが(自分のやり方の問題の可能性あり)、取り組み…

Command Lineでkaggleに参加

概要 GCPを活用して、kaggleに参加したいので、command lineからデータをダウンロードしたいと考えていたら、パッケージがあったのでインストールする。 参考したのは以下そのまま。 Kaggle: Your Home for Data Science GitHub - floydwch/kaggle-cli: An u…

Google Compute EngineにJupyterをインストールしてブラウザからアクセスできるようにする

概要 前回構築したGCPのデータ分析環境にJupyter等を入れてブラウザでアクセス出来るようにし、分析を実行できる環境を構築する方法のメモです。 rf00.hatenablog.com Anacondaのインストールと、ファイヤーウォールの設定のみで簡単に可能です。

Google Cloud Engineでデータ分析用のインスタンスを作成する

概要 Google Cloud Engine上にデータ分析のためのインスタンスを作成した際の方法のメモです。