振り込め詐欺の被害が再び拡大傾向にある。詐欺被害を防止すべく、最新の音声技術を活用した対策が実現しつつある。犯罪者、被害者双方の発話を2つの仕組みで分析。精度は90%以上という。

 「今回の補償の件について、今からそちらに伺います」

 「えっ! そんなことを突然言われても…」

 「では、すぐにお金を振り込んでもらえますか?」

 この会話は被害者側の固定電話を介して行われる、いわゆる「振り込め詐欺」の一例である。最悪の場合、被害者は「自宅に来る」と強調する犯人からのプレッシャーに負けて詐欺にかかり、彼らが言う「補償金」を言われるがまま指定された口座などに振り込んでしまう恐れもある。

 警察庁のデータによれば、振り込め詐欺がピークを迎えたのは2008年。認知件数は2万481件、被害金額は約276億円に及んだ。以後、犯罪への啓蒙活動のかいもあり、その数は激減した。しかし最近、被害額が再び増加傾向にある。特に「オレオレ詐欺」や「還付金詐欺」の増加が顕著だ。

 これまで、電話を用いて不特定の人を巻き込む詐欺を未然に防ぐ抜本的な方策はなかった。だが、ここにきて最新技術を使った防止策が実現しつつある。富士通のモバイルフォン事業本部と名古屋大学大学院情報科学研究科の武田一哉教授が共同で、2009年から「振り込め詐欺誘引通話検出技術」の研究に着手。実用化に向けた実証実験までこぎ着けている。富士通モバイルフォン事業本部の松尾直司・先行開発統括部長付は「この技術を使えば、90%以上の精度で詐欺を検出できる」と胸を張る。

怪しいキーワードを抽出

 犯罪者と被害者の会話をそれぞれ別個に働く仕組みで分析する。犯罪者側の発話では音声認識技術を使い、被害者側の発話については声の大きさと高さの変化を検出する。双方の分析結果を合わせたうえで、詐欺かどうか最終的な判断を下すのだ。2つの技術を組み合わせることで、精度を高めた。

 犯罪者の発話を分析する音声認識技術では「事故」や「不祥事」「お金を使い込んだ」「借金」「補償」など、振り込め詐欺でよく使われるキーワードを抽出する「ワードスポッティング」という技術を利用している。富士通が以前から持つノウハウだが、振り込め詐欺を検出する技術への応用では「若干の調整も必要だった」(松尾部長付)という。電話線を通した声は本来の声と比べて帯域が狭くなり、声がこもってしまうからだ。

 抽出するキーワードについては、警察大学校から参考情報として提供されたリストに加え、富士通が独自に調査したものを使っている。その内容については「キーワードを知られてしまうと、犯罪者に利用されてしまう」(松尾部長付)という理由から非公開だ。このリストの言葉を通話相手がどれだけ使ったか、その数を数えて振り込め詐欺の可能性を算出する。

 だが、研究を進めると、音声認識だけでは精度を高めるのが難しいことが分かった。理由は2つある。まず「借金」や「事故」といったキーワードは詐欺だけでなく、一般的な会話でも使われる。こうした言葉が通話相手から検出されたとしても、詐欺だとは決めつけられない。

 もう1つの理由は「被害者側の声」にある。松尾部長付は説明する。「当初は音声認識をメーンに検出技術を組み立てようと考えていた。ただ、詐欺に遭うと被害者の声が不明瞭になり、正確に認識するのが難しかった」。冒頭のような会話で強いストレスにさらされる被害者の声はかすれたり、震えたりするほか、気が動転して言葉にならない声を発することも多い。そのため、被害者側の声を犯罪者側のように正確に検出するのは簡単ではなかった。

振り込め詐欺防止の流れ
通話相手との会話をシステムが把握し、疑わしいキーワードを検出したり、判断力が落ちている状態(過信状態)をつかんだりして詐欺かどうかを判断する。振り込め詐欺の可能性が高い場合は、被害者に警告を発し、警察や親族、銀行などにも通報。被害を未然に防ぐ

危うい「過信状態」

 そこで富士通は名古屋大学の武田教授に協力を依頼し、同教授が研究するもう1つの仕組みを取り入れた。被害者側の声の調子を分析し、「過信状態」に陥っていないかを判断する仕組みである。

 過信状態とは「相手を信用しすぎて、正常な判断ができなくなる状態」や「対象に対して考察力が落ちている状態」を指す。対象は人に限らない。例えばワープロに頼りきった結果、漢字を覚えられなくなるといった状況は、機械に対する典型的な過信状態である。その対象が人間、特に振り込め詐欺の犯罪者であれば、彼らの会話に振り回され冷静な判断ができなくなるのも過信の1つ。結果、相手の言うことを信用してお金を騙し取られてしまう。

 なぜ人は過信状態に陥ってしまうのか、正確なメカニズムの研究はまだ途上だという。ただ「過信状態と見られる現象を集め、その特徴を見いだして検出するアルゴリズム(計算手法)を組み立てることは可能」と武田教授は言う。被害者の声がストレスでかすれてしまったりする現象を利用し、その変化を計測して過信状態かどうかを見極める。つまり、音声認識では課題になっていた部分を逆手に取るわけだ。

 例えばギターやピアノなど楽器の音色には、それぞれ特徴的なパターンがある。ピアノであれば440ヘルツの高さの音を主成分にしているが、それ以外の周波数の音も同時に出す。この様々な周波数の集合が、ピアノの音色を特徴づけている。

 声も声帯を震わせて発する点では、楽器と同じである。そこで、まず人間の声が持つ普遍的な周波数の分布をモデル化する。振り込め詐欺にさらされている被害者の声はかすれたり震えたりしているので、このモデルと大きくずれてくる。「本来なら発せられる周波数が出なくなったり、普通は出ない周波数が検出されたりする」(武田教授)。

 通話中の被害者の声をリアルタイムで把握し、モデルとのズレが一定のレベルを超えた時、被害者は「過信状態」にあるとシステムが結論づける。これに犯罪者側の音声認識を合わせて判断することで、9割を超える検出精度を実現した。

技術導入で詐欺半減

 今年8月には岡山県で振り込め詐欺誘引通話検出技術の実証実験が始まった。一般家庭の100人以上に検出技術を組み込んだ固定電話を利用してもらい、岡山県警察、警察庁中国管区警察局岡山県情報通信部、中国銀行などの協力も得た。

 「岡山県では2012年に入って振り込め詐欺被害の認知件数が急増していた。岡山県警が新たな対策としてこの研究の成果に着目し、実証実験を行うことになった」と岡山県警察と警察局岡山県情報通信部は説明する。

 実証実験では、振り込め詐欺を検出した段階で固定電話に取りつけられたシステムが「振り込め詐欺の恐れがあります。ご注意ください」という警告を被害者に発する。同時に警察、銀行、被害者の親族、そして富士通にも通報。即座に警察は被害者宅に向かい、銀行はあらかじめ依頼されている口座を支払い停止にする。富士通はその会話を分析し、さらなる精度向上のためにデータを活用する。こういった具合に、地域の関係機関が連携する仕組みが整えられた。実験開始後、それまで月平均で6件あった県内の振り込め詐欺の認知件数が半減したという。

 ただ「この技術が実用化するのは、まだ先になりそう」と富士通の松尾部長付は言う。振り込め詐欺を防ぐには、単に検出技術を導入するだけでなく、岡山県の事例のように警察、銀行、親族など多様な関係者による広範な「振り込め詐欺防止のインフラ」作りも不可欠だからだ。

富士通はアンドロイドのスマートフォン向けにも、振り込め詐欺誘引通話検出技術を組み込んだアプリケーションを開発中だ

 一方で、まだ製品化してはいないものの、富士通はこの技術をアンドロイドのスマートフォンでも使えるようアプリケーションを開発している。今後は固定電話だけでなく、スマホを使う相手に対する犯罪も急増する可能性があり、活用の余地は大きそうだ。

 振り込め詐欺の手口は年々巧妙化している。音声技術を用いた新たな対策は犯罪防止の救世主となり得るか。期待が高まっている。

(飯山 辰之介)

日経ビジネス2012年11月26日号 78~90ページより目次