全3347文字

 統計データを分析する際に使う「R」というプログラミング言語がある。無料のオープンソース・ソフトウェアで、Rを使えば、データの加工や操作、線形回帰、ランダムフォレストのような機械学習の分析、解析したデータの可視化が可能になる。「Python(パイソン)」と並び、統計分析を手がける人々に人気の言語だ。

 Rはオープンソースのため世界中のエンジニアが修正や機能追加を進めている。その中で、データフレームの操作に特化した「dplyr(ディープライヤー)」やデータ可視化の「ggplot2(ジージープロット2)」など、人気のパッケージ開発で貢献した人物がいる。ソースコードの入力からコンパイルやデバッグまでが可能なRの総合開発環境を提供するRStudioのチーフ・サイエンティスト、ハドリー・ウィッカム氏だ。

 ウィッカム氏が独力で作り上げたパッケージは今では大学の研究者からジャーナリストまで、数多くの人間が使っている。Rに対する多大な貢献のため、ユーザーの間で「神」とあがめられている。

 日経ビジネスは2019年1月7日号で「会社とは何か」という特集を組んだ。特集では様々な角度から会社の役割の変化を論じているが、その中に社会課題を解決するために、自身のナレッジや経験を惜しみなく投入する“新人類”についても触れている。ウィッカム氏もそんな新人類の一人だ。なぜRの開発にボランティアでか変わったのか。ウィッカム氏に話を聞いた。

ウィッカムさんはいつからRの開発に関わり始めたのでしょうか。

ハドリー・ウィッカム氏(以下、ウィッカム):16~17年前に始めたので2002年だと思います。当時、私はニュージーランドのオークランド大学医学部で勉強していたのですが、医者にはなりたくないと思い、統計学とコンピューターサイエンスに専攻を移したんです。その授業中にRの存在を知りました。

統計言語 「R」を基にした数々の人気パッケージ開発に貢献したハドリー・ウィッカム氏(写真:Misun photography)

10年間、数千時間をコード書きに費やした

Rは、カナダのウォータールー大学の教授だったロバート・ジェントルマン氏がオークランド大学で短期間、教えていた時に、統計学の教授だったロス・イハカ氏と出会い生まれたと聞いています。

ウィッカム:そうです。オークランド大学がRの発祥の地です。

ウィッカムさんはdplyrやggplot2など、現在のRに欠かせないパッケージを作りました。でも、Rはオープンソース・ソフトウェアなので無償です。なぜボランティアでRの開発に取り組んだのでしょうか。

ウィッカム:今はRstudioで給料をもらっているので状況は変わっていますが、学生だった当時は世界に対する影響力、さらに他の人々の手助けができるという点でオープンソースに夢中になりました。データ分析という面でRは素晴らしい技術です。それが無料で使えるというのも素晴らしいことです。ただ、少し専門的だったので、いろいろなことをもっと簡単に実行できるようにして、社会に恩返しをしたいと思ったんです。