2015年04月01日

Siriの機能をOSSで実現できる「Sirius」の作者紹介記事

Sirius、話題になってますね。AppleのSiriの機能をオープンソースで実現することを目指したプロジェクトです。

本プロジェクトの内容は、公式サイトでは下記のように説明されています。

Sirius: An Open Intelligent Personal Assistant
(Sirius: オープンソースの知的パーソナルアシスタント)

Sirius is an open end-to-end standalone speech and vision based intelligent personal assistant (IPA) service similar to Apple’s Siri, Google’s Google Now, Microsoft’s Cortana, and Amazon’s Echo.

Siriusはオープンで、スタンドアローンで完結した、AppleのSiri、GoogleのGoogle Now、MicrosoftのCortana、AmazonのEchoのような音声と画像ベースの知的パーソナルアシスタント(IPA)サービスです。

今日はSiriusの作者の談話が多く含まれた記事を読んだのでご紹介。

Voice Control Will Force an Overhaul of the Whole Internet
(音声操作がインターネット全体を刷新する)

Jason Mars built his own Siri and then he gave it away.

Jason Marsは彼自身のSiriを作り上げ、そして公開した。

作者のJason Mars氏はMichigan大学の教授で、パーソナルアシスタントを作成して公開しました。

単にSiriに似たものを作るだけでなく、スタンドアローンで完結しているところもSiriusの1つの特徴です。

You see, digital assistants like Siri and Google Now and Microsoft Cortana don’t just run on your phone. They run across thousands of machines packed into these enormous computing centers, and as we extend such services to more and more people across the globe, we can’t just run them on ordinary machines.

Siri、Google Now、Microsoft Cortanaのようなデジタルアシスタントは、あなたの携帯だけで動くわけではありません。数千台のマシンが動く巨大なデータセンターで動いていて、普通のマシンで動作させることはできません。

こうした状態に対して、より適切なデータセンターのデザインはないか、というのがSirius開発の1つの動機だそうです。

Ultimately, that’s why Mars is running his Sirius project. The Apples and Googles and the Microsoft know how this new breed of service operates, but the rest of the world doesn’t. And they need to.

究極的には、それがMarsがSiriusプロジェクトを立ち上げた動機です。Apple、Google、Microsoftはこの手のサービスを運用できます。しかし世界中のそれ以外の人々はできません。それを必要としていても。

Siriusは現状はUbuntuのみですが、データセットも含めて公式サイトからダウンロードして実行することができるようになっています。Wikipediaのデータセット付きだとおよそ11GB(Gzip圧縮済み)のファイルになっていました。

記事内ではまた、GPUFPGA(後付けでCPUの構成に手を加えられるヤツ)について語られています。

CPUはSiriusのような用途に対してはあまり適切ではありません。Deep Learning系の処理はライブラリがGPUを利用するケースが多いですが(Siriusが利用しているCaffeもGPUを利用しています)、FPGAも有望な選択肢です。

FPGAs are potentially much more efficient than GPUs (according to the University of Michigan tests, FPGAs can provide about 16 times the performance, versus about ten times for GPUs). But they require more design work.

FPGAはGPUよりもポテンシャルは高いです。Michigan大学のテストでは、GPUが10倍速であったのに対して、FPGAは16倍のパフォーマンスを出していました。しかしそうしたパフォーマンスを得るには専門的な作業が必要になります。

FPGAというと、昨年、MicrosoftがBingのサーバに導入したニュースが大きく取り上げられていましたね。

When you consider that many of the big internet companies, including Facebook and Microsoft, are also exploring the use of low-powered ARM chips inside their data centers, the chip market is poised for an enormous shift over the next several years. Jason Mars and his Sirius project aims to show what this will look like. But Sirius could also feed the big shift. After all, if everyone runs their own Siri, they’ll need their own chips.

巨大なインターネット企業を見てみると(FacebookやMicrosoftを含めて)ARMチップの低電力をデータセンターで試しています。チップ市場はこれから数年で大きくシフトしようとしています。Jason MarsとSiriusは今後のデータセンターがどのようにあるべきかを提案し、その流れを加速させようとしています。もしすべての人が自身の端末でSiriを動かすことになれば、それに合ったチップが必要になります。

機能だけに目が行きがちなSiriusですが、データセンターの在り方、FPGAなどによる負荷の低減なども含めて、増大するパーソナルアシスタントの需要を効率的に処理することが大きな目標としてあるようです。

posted by newsit at 07:00| machine_learning