2015年04月12日

AWSに機械学習サービスが追加されたらしい

先日、Azurの機械学習周りの記事を取り上げましたが、今回はAmazonのお話。

かなりインパクトのあるニュースで、日本語の記事もAmazon Web Services ブログTechCrunchなどで出ています。

興味があったので私もいくつか関連記事を読んでみました。

まずはForbesあたりから。

Amazon Introduce Machine Learning. As A Service
(Amazonが機械学習の新サービスを発表)

Enter AWS, who is following in the footsteps of its competitor, Microsoft Azure, and introducing a machine learning service. Using the service, developers can use machine learning within the applications they build and run on AWS.

クラウドの競争相手であるMicrosoftのAzureに追従して、AWSも機械学習サービスを発表した。開発者はAWS上で機械学習機能のビルドと実行が可能になる。

ということでこの分野ではAzureの方が先行していましたが、AWSも当然ながら対抗してきたようです。

下記はHacker Newsの反応。

Amazon Machine Learning – Make Data-Driven Decisions at Scale | Hacker News

AzureやGoogleのPrediction APIとの比較などが話題に上がっています。

値段のことも気にされているようです。

So the pricing is $100 per million data points, at minimum. That doesn't seem like it scales well for big data at all.

100万件につき100ドルっていうのは、big dataでは使えないよね。

例えば100万ユーザを持つサービスでユーザ1人につき1回叩いて1万円、と考えると十分に使える値段ですが、迷惑メール判定とか各レコードごとの異常検出とかになると件数が軽く億単位になったりするので、そういうbig dataへの適用は厳しそうです。

また、生成したモデルをエクスポートしてローカルで使うことも現状ではできないようです。

下記はAWS公式サイトのFAQ

Amazon Machine Learning | FAQs

Q: Can I export my models out of Amazon Machine Learning?

No.

Q: Can I import existing models into Amazon Machine Learning?

No.

Q: Amazon Machine Learningで生成したモデルをエクスポートすることはできますか?

できません

Q: 既存のモデルをAmazon Machine Learningにインポートすることはできますか?

できません

モデルの生成はクラウドで、モデルの利用はローカルで、というパターンはけっこうありそうな気がしますが、それはできないようです。

あとはアルゴリズム。

Q: What algorithm does Amazon Machine Learning use to generate models?

Amazon Machine Learning currently uses an industry-standard logistic regression algorithm to generate models.

Q: Amazon Machine Learningでモデルを生成する際に使えるアルゴリズムは?

Amazon Machine Learningは現状では、モデル生成ではロジスティック回帰が利用できます。

現状はロジスティック回帰のみのようです。二値分類とか回帰ができるらしいですが、ロジスティック回帰なら両方つつがなくできるので、特に問題はないでしょうか。

サービスを見た限りではまだAzureの方がだいぶ先行しているように見えます。アルゴリズムの数にも差がありますし、Rと仲が良いところも評価高いです。

とはいえAmazonのことなので、これまでやってきたように今後もどんどんサービスを発展させていってくれるでしょうから、1年後にはずっと凄いサービスになっているんじゃないかと期待してます。

posted by newsit at 07:00| machine_learning