【論文メモ】Email Volume Optimization at LinkedIn
読んだ論文
今回読んだ論文は以下
間違い等ありましたらご指摘お願いいたします。
注目した部分
- 最適化と予測モデルの組み合わせのアプローチ
概要
LinkedInにおけるemailの送信量の最適化の方法の説明。
LinkedInでは様々なメールが配信されているが、ユーザーへのメールの送信量を多くするとサイト訪問は増えるが、メール配信を解除してしまうユーザーも出てきてしまう。
論文ではそのトレードオフを踏まえて、サイト訪問を最大化し配信停止を最小化するようなメールの送信量を送る方法を考えている。
方法としてはサイト上での実験によって得たデータからメールの開封と配信停止の予測モデルを構築し、その予測モデルを活用して送信料最適化のためのパラメータを多目的最適化で求めている。
方法
最適化と多クラス分類の予測モデルの組み合わせを行っている。
最適化
最適化したい式を以下のように設定している。
ここで、は事前の送付確率、は正則化パラメータ、は色々と式変形を経て、
で定義される。
この、 ,
が求めたいパラメータになる。
送信するかどうかのルールは以下の式で決定する。
つまり、訪問する可能性にパラメータをかけたものが配信停止の可能性にパラメータをかけたものに対して1より上回っていれば送信するというようなルールになる。
予測モデル
最適化の式に出てきた、(メール毎のメールを開封してサイト訪問する確率)と
(メール毎の配信解除やスパム連絡をされてしまう確率)
は予測モデルを構築し、実データから求めている。
特徴量は以下のようなものを使っている。
送信対象のプロフィール
送信対象の直近の行動
送信対象の過去メールを受けとった後の行動
メールの内容
結果
全てのメールを送るユーザーと、論文中での提案手法によって送信料をコントロールしたユーザーとでA/Bテストを実施し結果を比較、以下表のような結果が見られた。
一番右がオンラインのA/Bテストの結果で、全体的にセッション(サイト訪問)が微減し、不満(配信停止等)は大きく減少している、
所感
実務上の問題を解決するような話だったので、実際に自分の仕事に参考にしやすいと感じた。
ただ最適化の部分は正直難しくて理解しきれてはいないので今後の課題としたい。