データとAI(人工知能)を使いこなす企業が競争上の優位を獲得する――。そう叫ばれるようになって久しいが、「R」や「Python」などのプログラミング言語に精通した人材がいなければ、機械学習や深層学習のアルゴリズムを使って分析することもできないのが現状だ。
グーグルやフェイスブックなどシリコンバレーのテック企業は機械学習や統計のアルゴリズムを用いてデータに隠れているパターンや傾向を見つけ出し、サービスの改善に結びつけている。それに対して、エンジニアの数がそもそも少ない日本企業はうまく活用できていない。
その状況に風穴を開けようとシリコンバレーで奮闘している日本人がいる。R言語やPython言語でプログラミングすることなく、最先端のアルゴリズムを活用できるデータ分析サービス、「Exploratory(エクスプロラトリー)」を開発した西田勘一郎氏だ。
エクスプロラトリーはR言語のオープンソース・ソフトウェアなどで構築されており、データを投入すれば、シンプルなUI(ユーザーインターフェース)でデータの加工やアルゴリズムを使った分析、データの可視化などが可能になる。異なるデータの結合やデータタイプの変換など想像以上に簡単だ。
シリコンバレーのプログラマーに限定されていたデータサイエンスの“民主化”に尽力する西田氏に話を聞いた。
(ニューヨーク支局、篠原匡)
オープンソース化で薄れる大企業のアドバンテージ
西田さんはもともとオラクルでBI(ビジネス・インテリジェンス)ツールやデータ分析ツールの開発に関わっていました。なぜオラクルを辞めて、スタートアップを始めたのでしょうか。
西田勘一郎(以下、西田):私が社会人になった20年ほど前、データ分析のアルゴリズムはSASやSPSS、IBM、オラクルなどのエンタープライズ・ソフトウェアベンダーが高額のライセンス料を取って提供していました。私のようなエンジニアの観点でいえば、オラクルのような企業にいることで、その会社にしかない最先端の技術に触れることができたんです。

データベースやアプリケーションサーバーを手がける米オラクルで長年、データサイエンス関連プロダクトの開発ディレクターやプロダクトマネジャー、コンサルタントなどを歴任。2016年にシリコンバレーでエクスプロラトリーを創業した。(写真:Angelica Vasquez)
ところが、過去10年くらいでそういったアルゴリズムのオープンソース化が加速したことで、大企業にいるアドバンテージがなくなってきました。
オープンソースはコミュニティ参加型の開発のためスピードが速く、優秀なエンジニアの手がいくつも加わるのでクオリティが高い。それでいて、オープンソースですからコストも信じられないほど安い。オラクル時代の最後の3年間はオープンソースのテクノロジーを自分たちの製品にどうやって組み込むかということが中心でした。その中で、大企業にいる意味がどこまであるのかな、と。
また、私たちのようにシリコンバレーにいると当たり前になっていることが、ほかの世界では当たり前じゃなく、どんどん差が開いているという思いもありました。データ分析のオープンソース・テクノロジーにしても、われわれは普通に活用していますが、IT(情報技術)やプログラミングに関係のない人々はその存在も意味も分からない。
私の妻はインテリアデザインの仕事についていますが、テクノロジーの進化に全くついていけていません。彼女のご両親と話しても、テクノロジーに関しては会話が成立しない。そうこうしているうちに、シリコンバレーの会社だけが、データを使いこなしている企業だけが加速度的に成長している。このギャップを埋めるようなことができないかということが起業のきっかけです。
Powered by リゾーム?