12/06/2016

AIブームも破綻するだろう

ジョージ・メイソン大学の経済学者ロビン・ハンソンのブログovercomingbiasより

パイプ(管)のイノベーションを想像してほしい。このイノベーションが一般的であるなら、あらゆるパイプを安価に作ったり維持できれば、総利益は大きくなり、もしかすると今日パイプに費やす総額に匹敵するだろう。(あるいは更に大きくなるだろう。) そして、パイプ利用の価値の大部分が多くの小規模利用にあるなら、それが経済的利益の大部分が見つかるポイントである。

その一方、非常に巨大なパイプのみを改善するイノベーションを考えてみる。このイノベーションは、例えば、パイプ1メートルあたりの利用に多くのコストが掛かるので、そのため巨大なパイプだけが有用である。そのようなイノベーションは、巨大で色鮮やかなパイプを使って、とても劇的なデモを行うかも知れないので、メディアの注目を集めるだろう。しかし、総合的な経済的利益はおそらく小さくなるだろう。そして、大部分のパイプの価値は小さなパイプの中で見つかり、巨大なパイプの利益はそれほど大きなものではないだろう。

今までで私の最も拡散したツイートを考えてみよう:

素晴らしいCSの専門家が言う: 高度なAI/ML(機械学習)が欲しいと考える大部分の企業は実際には整理されたデータ上での直線回帰が必要に過ぎない

これはそのような問題が舞台裏で実行されると見る人々から普遍的な合意を得た。そして、パイプのイノベーション事例の類似性によって、この事実は機械学習での最新のイノベーションの潜在的で短期の経済的影響について何かを教えてくれる。それを説明しよう。

ほとんどの企業はまったく使われていない大量のデータを持っているのに、はるかに多くのデータがそこそこのコストで収集することができるようになっている。時々、このデータの一部を使って興味のあるものを予測している。また時には、大きなビジネス価値を作り出すことがある。この価値の大部分は相変わらず、単純で小さなデータセットに適用される単純な予測手法を使って、単純なアプリケーションで実現される。そして、達成された総価値は、少なくともデータから予測を専門的に扱う労働者や企業が得た収入によって測られる通りで、世界経済にとってはるかに少数である。

多くの障害がそのような用途を制限する。例えば、意思決定に関わるより良い予測の価値は低いかも知れない。データは予測を知らせることに適さない形式かも知れない、予測をうまく利用するにはより大きな再編成を必要とするかも知れない、データの一部を保持する組織はデータのコントロールを失いたくないかも知れない。社員は、データのクリーニング、統合、分析やアプリケーションの最も効果的なアプローチを適用するための十分なスキルが足りないかも知れない。

おそらく、多くのエラーがデータ量や誰がいつ分析するかという選択肢の中で作られる。彼らは時には非常に多くの、時にはあまりに少ない予測をすることもある。技術が変わると、時には組織が新しい技術を試すのに時間が掛かり過ぎることがあり、時には技術が成長するのを十分長く待てないこともある。しかし、通常は、関連する技術が一定の既知の速度で改善される場合、我々はこれらの選択が平均して大きく誤っていると予測する強い根拠はない。

ここ数年、新しいディープマシンラーニング(深層機械学習)による予測手法がホットである。広く公表されたデモでは、データから大幅に精度を高めた予測が可能になったように思える。データが豊富な場合により輝くので、よりスキルの高い人材が必要となり、これらの手法は大きな予測問題には大いに有望である。この新しい方法によって、多くの企業では、これらの問題をよく理解していない人たちが新しい手法を使ったローカルアプリケーションを見つけ出すよう部下に求めている。部下たちは少なくとも表面上は従い、助けもあって、彼らや組織はスキルが身についたように見える。

この新しい方法の成果の一つは、まともな候補を作るための十分なデータや可能性がある予測値を持つ所で、いくつかの大きな新しいアプリケーションが探求されていることである。しかし、もう一つの成果は上記の私のツイートの中で説明されているものだ: ほとんどマッチしない小さな問題に対しても、流行に誘発された高価な新しい方法を乱用している。我々はこの2番目の成果が概して純損失を生み出すと予想すべきである。この損失の大きさは、いくつかの大きな新しいアプリケーションから得られる全てを上回るには十分である。結局、ほとんどの価値は普通多くの小さな問題から得られる。

しかし、私は純利益や純損失についてここで結論を出したくはない。私はむしろ世界経済への圧倒的な影響を持つ新しい予測技術の可能性をよく考えてみたい。この新しい手法をすぐに世界を飲み込む津波の最初の盛り上がりとして見る人もいる。例えば、2013年にフレイとオズボーンはよく知られているように次のように推測した:

米国の総雇用者の約47パーセントが今後10〜20年でコンピュータ化でなくなる恐れがある。

新しい予測技術が大きな変化を引き起こしたら、世界経済のかなりの割合を占める価値を創出するだろう。そして、世界の収入と同じ割合を消費するだろう。もしそうなら、予測産業は短期間で今日よりもはるかに大きくなるだろう。今日の手法がその巨額な成長の始まりであったなら、予測のアクティビティの増加だけではなく、そのアクティビティの中で畏怖の念を起こさせる成功率とならなくてはならない。これらの新しい方法のアプリケーションは非常に広範囲に利用可能なアプリケーションの領域に渡り、巨大で新しい収益源を利用可能にすべきである。

しかし、私はほとんどの予測値が存在する領域の中で、ほとんどの試みはこの新しい技術は実際には古い技術で達成されるものより正味の価値が少なくなると考えている。私は、予測分析技術は通常はプロセスの最も重要な部分ではなく、最近はこの新しい分析技術の熟練を示すことに執着することが、何のデータを予測したいのか、そしてデータをより有益な形式に慎重に整理し統合することについて慎重に考えるというよりも、重要で基本的な問題の無視につながると考える。

そう。例外がなければならないので、一部は大きいかも知れない。そのため、いくつかの大きなアプリケーションは大きな価値を生むかも知れない。そして、予測が大きな価値を与える準備ができており、最先端の予測技術を使って十分過ぎるほど正当化でき、ある程度正しいデータが大量に利用可能であれば、自動運転車は見込みのある候補に思える。しかし、自動運転車が数十年以内にほとんどのドライバに取って代わったとしても、仕事の自動化の割合は、歴史的な記録の範囲外ではない。そのため、「今回は違う」とは示せないだろう。その範囲から明確にするには、我々は同時代に大きく移転した別の10の雇用を必要である。それでも、20年以内に全ての仕事の半数を自動化するには不十分である。

ここでの結論は、この新しい予測技術はパイプのサイズを問わず、全てのパイプを改善できる新しいパイプ技術のように見える一方、実際は非常に巨大なパイプでのみ有益な技術のようだということである。全てのパイプに向けて、大きなパイプを有益にするだけのパイプ技術の強制が無駄であるように、高度な予測技術を標準的な予測課題に向けて押し付けても無駄かも知れない。そして、この新しい技術は主に稀な大きな問題にのみ役立つという事実は、全体の影響が制限されることを示唆している。20年以内に世界経済を再構築できるようなものではない。現在のブームがそのような壮大な考え(grand homes)に基づいている限り、このブームはすぐに破綻するに違いない。

Hacker News