ここ2年ほどは猫も杓子もDeep Learningの話で真っ盛りな機械学習界隈ですが、当初の「猫が識別できたぞー」といった実験的な話題と比べると、最近は企業の実例の話が出てくることも増えてきた感があります。
ということで本日のお題。
How PayPal uses deep learning and detective work to fight fraud
(PayPalはディープラーニングを利用してどのように詐欺と戦っているか)
Deep Learningの凄いところはどの分野でも成果を上げていることです。
which has led to some huge advances in computer vision, speech recognition, text analysis, machine listening and even video-game playing in the past few years.
(Deep Learningは画像認識、会話認識、文書解析、音声認識、そしてビデオゲームのプレイまで、幅広い分野で成果を挙げています)
PayPalでは詐欺行為の推定にこの技術が使われているそうです。複雑に絡み合った多数の特徴の分析で力を発揮しているそうです。
The deep learning algorithms are able to analyze potentially tens of thousands of latent features (time signals, actors and geographic location are some easy examples) that might make up a particular type of fraud
ディープラーニングは数万の潜在的な特徴(時間や行動、位置情報などは代表的な特徴)を分析して、詐欺師の特徴的なタイプというものを洗い出します。
PayPalのエンジニアブログでは、今年の1月にこんな記事を投稿しています。
Deep Learning on Hadoop 2.0
(Hadoop2.0でディープラーニング)
Parallelization of Deep Networksなどを参考にYARN(Hadoop2から加わった並列処理の仕組み)でDeep Learning(DBN)を実行しているようです。かなり頑張っている感がありますね。
昨年の12月には下記のようなスライドも出しています。
PayPal's Fraud Detection with Deep Learning in H2O World 2014
(PayPalのディープラーニングを使った詐欺発見 - H2O World 2014)
1億6千万レコード、1500の特徴、圧縮後サイズ0.6TB。HadoopはCDH3で800ノード。このデータでH2Oを利用してレコードが詐欺かそうでないかを判定を実験したレポートが載っています。使用したデータでは6層で各600ニューロンの時がもっとも精度が良かったとか。
研究課題が詐欺に絞られている点をみるに、決済サービスのPayPalにとって詐欺行為は相当負担になっているようですね。 詐欺を判定するテクノロジーが進化して安価に導入できるようになれば、世の中の詐欺行為ももう少し減るでしょうか。しかし対策されればさらにその裏を突くのが人間の得意なところ。
こうしたジャンルは、今盛んに言われている人間とAIの戦いの最前線と言えるかも知れません。