Deep Karmaning

技術系の話から日常のことまで色々と書きます

【論文メモ】Email Volume Optimization at LinkedIn

読んだ論文

今回読んだ論文は以下

www.kdd.org

間違い等ありましたらご指摘お願いいたします。

注目した部分

  • 最適化と予測モデルの組み合わせのアプローチ

概要

LinkedInにおけるemailの送信量の最適化の方法の説明。

LinkedInでは様々なメールが配信されているが、ユーザーへのメールの送信量を多くするとサイト訪問は増えるが、メール配信を解除してしまうユーザーも出てきてしまう。

論文ではそのトレードオフを踏まえて、サイト訪問を最大化し配信停止を最小化するようなメールの送信量を送る方法を考えている。

方法としてはサイト上での実験によって得たデータからメールの開封と配信停止の予測モデルを構築し、その予測モデルを活用して送信料最適化のためのパラメータを多目的最適化で求めている。

方法

最適化と多クラス分類の予測モデルの組み合わせを行っている。

最適化

最適化したい式を以下のように設定している。

f:id:rf00:20180504112051p:plain

ここで、{\displaystyle q}は事前の送付確率、{\displaystyle \gamma}正則化パラメータ、{\displaystyle z_e}は色々と式変形を経て、

f:id:rf00:20180504111915p:plain

で定義される。

この、 {\displaystyle \mu^*_t},

{\displaystyle v^*_t}

が求めたいパラメータになる。

送信するかどうかのルールは以下の式で決定する。

f:id:rf00:20180504113522p:plain

つまり、訪問する可能性にパラメータをかけたものが配信停止の可能性にパラメータをかけたものに対して1より上回っていれば送信するというようなルールになる。

予測モデル

最適化の式に出てきた、{\displaystyle P_{sess}(x_e)}(メール毎のメールを開封してサイト訪問する確率)と

{\displaystyle P_{comp}(x_e)}(メール毎の配信解除やスパム連絡をされてしまう確率)

は予測モデルを構築し、実データから求めている。

特徴量は以下のようなものを使っている。

  • 送信対象のプロフィール

  • 送信対象の直近の行動

  • 送信対象の過去メールを受けとった後の行動

  • メールの内容

結果

全てのメールを送るユーザーと、論文中での提案手法によって送信料をコントロールしたユーザーとでA/Bテストを実施し結果を比較、以下表のような結果が見られた。

f:id:rf00:20180504110220p:plain

一番右がオンラインのA/Bテストの結果で、全体的にセッション(サイト訪問)が微減し、不満(配信停止等)は大きく減少している、

所感

実務上の問題を解決するような話だったので、実際に自分の仕事に参考にしやすいと感じた。

ただ最適化の部分は正直難しくて理解しきれてはいないので今後の課題としたい。