読者です 読者をやめる 読者になる 読者になる

なぜVRが普及すると確信するに至ったのか

前回のブログ記事では、今後数十年でVRがどのような役割を果たすかについて書きましたが、今回は歴史の中でVRがどのように位置づけられるかについて書きたいと思います。
それは、なぜ自分がVRが普及すると確信するに至ったのかという理由でもあり、VRは情報の歴史の発展性の文脈の中に綺麗に位置づけられるのです。
 
情報の歴史を紐解くと、VRは「音声」「文字」「画像」「映像」に次ぐ第五の情報の表現手段でであることが見えてくると思います。
19世紀後半に映像が登場してから、新しい情報表現が普及することは100年以上ありませんでした。
情報の歴史を、情報の表現手段と性質に分けてまとめたのが以下の図です。
 
○ 口伝
● 文字
◎絵
●◎ 手紙
◎写真
○ 電話
● タイプライター
○ レコード
○□ 映画館
○ ラジオ
○□ テレビ
○□ ビデオ
●◎ FAX
○●◎□ パソコン
●◎ パーソナルプリンタ
○□ テレビ電話
■ 施設型VR(初期のVRブーム)
○●◎□ インターネット(PC)
○ 携帯電話
○●◎□ スマートフォン
■ 現状のVRデバイ
○●◎□■ 将来のVR/ARデバイ
<情報表現>
○:音声
●:文字
◎:画像
□:映像
■:VR
 
 
<情報の性質>
斜体:パーソナルに情報を保存する手段
細字:一対一での情報のやりとり
太字:大多数の人に向けて同じ情報を発信
赤字:携帯できる
下線:誰もが情報を生み出せる
フォント大:距離が離れていても瞬時に発信
(電子的に発信)
 
 

 

人間はまず、話し言葉として言語を獲得し、文字で書くことで、時間、空間を超えて情報を伝達できるようになりました。
書き言葉も初めは、手書きなので少数の人にしか伝達できず、声が主体で音読する性質が強いものでした。
しかし、活版印刷が発明されると、多数の人間に情報を伝達することができるようになり、声より文字が主体となって論理的、抽象的な思考を獲得するようになります。
 
一方、視覚情報を伝える手段として、古くから絵が使われましたが、19世紀初めに写真が発明され、視覚情報をそのまま記録、伝達できるようになりました。
19世紀後半には、映像を記録、再生できるようになり、映画により大衆に広く普及していくことになります。
 
19世紀以前に、「音声」「文字」「画像」「映像」 が出そろいましたが、20世紀以降は新しい情報表現手段の大きな普及はありません。
その代わりに、20世紀以降はこれらの情報を電子的に伝達する手段が、手を変え品を変え様々な形で発展していくことになります。
面白い事にそれらの発展の順番としては、まず音声から始まり、文字、画像、映像と、19世紀以前の情報表現の発展の順番をなぞる傾向が見えてきます。
 
まず誰もが電子的に情報を発信する手段としては、19世紀後半に電話が発明されました。
20世紀前半には、FAXで文字、画像情報を誰もが伝えられるようになりました。
映像を伝える手段としてはテレビ電話が登場しましたが、普及するまでには至っていません。
そして、1990年代のインターネットの登場で誰もが自在に音声、文字、画像、映像を伝えられるようになりました。
 
一方、大多数の人に対して電子的に情報を伝える手段としては、まずラジオが普及しました。
その後、テレビが普及し、大きな力を持つメディアに発展しました。
そして、インターネットの登場、SNSの普及により、誰もが多くの人に情報を伝えるメディアとなりうる時代になってきています。
 
携帯してどこでも情報を伝えられるようになる手段としては、まず携帯電話が普及しました。
しかし、携帯電話はあくまで音声を伝える電話として設計されていて、文字、画像、映像を伝えられるように進化はしたものの、付加的な機能として位置づけられていました。
それがiPhoneの登場により、音声、文字、画像、映像を自在に伝える携帯インターネットマシンとして普及し、スマートフォンの時代に突入していくことになります。
 
インターネット、スマートフォンは、今まで音声中心だったものが、それ以外の情報表現を自在に伝えられるようになる進化と捉えることができます。
また、インターネット、スマートフォン上でのサービスを詳しく見ると、最初は文字主体で、写真が取り入れられていって、最後に映像に関するサービスが普及し、次のデバイスの時代へと移行していっています。
インターネットが始まって10年以上たった2006年にYoutubeが登場し、Ustreamニコニコ動画など動画サービスが普及してから、スマートフォンの時代へと移行していきました。
現在、スマートフォンにおいては、Snapchatなどの動画サービス、動画広告が花盛りで、次のVR/ARの時代へと突入しようとしています。
 
では、なぜ音声を伝えるものが最初に普及するのでしょうか?
一つには人間の体を直接使って情報を発信する手段として、音声が最も速くて簡単だからというのがあります。
キーボードだとトップレベルのタイピングスキルを持つ人でないと音声の入力スピードは超えられず、リアルタイムでのやりとりが必要なシーンでは今でも電話が使われていると思います。
 
また、胎児や、生まれたての段階では、視覚より聴覚優位なのが、だんだんと視覚優位になっていくという人間の発達過程にも関係しているのかもしれません。
前述した人類の言語獲得の順番もそうですし、 視覚に比べて聴覚はより原始的であると言えます。
 
聴覚はあらゆることをリアリティを持って感じることができるので、聴覚のVRはそもそも実現できていると言えるのかもしれません。
ヘッドホンをつけたり、また、ただ大きな音を出すだけで、それ以外の聴覚情報はほとんど遮断され、それだけがリアリティとなります。
また聴覚は視覚に比べて空間認識能力が低いので、内側に入りこむ感覚を味わうことになり、それゆえ、演説、お経などが説得力を持ち、人の心を動かしてきたのだと思います。
 
逆に文字は直接的なリアリティをそぎ落した表現です。
特に活字は、音声に比べて、情報量が極端に少なく、その分を人間の想像力に頼っています。
画像→映像→VRという情報表現の進化は、文字によって失われた情報を補い、ついに視覚のすべてを乗っ取るまでになったと言えるでしょう。
VRは、人間の想像する余地を極限まで減らし直接体験することに価値があるので、その意味でVRは文字と真逆の表現であるといえます。
 
なお、VRは20世紀後半に登場したもので、1990年前後にも大きなブームがあったことに言及しないといけません。
しかし、当時はかなり高額で、テーマパークなどに行かないと体験ができず、家庭用に登場したのは、バーチャルボーイなどかなり不完全なものでした。
今は誰もが買って家で体験することができ、ネットで情報を瞬時に伝えられます。
同じ映像を扱っていても映画館と家庭用テレビがまったく違うように、当時とは大きな差があるのだと思います。
 
また、情報表現として、VRに深い関係を持つ「3D」についても言及しないといけないと思います。
2010年前後に3D映画や3Dテレビのブームがあったことは、昨今のVRブームと関係があり、歴史上、3Dのブームが来た後にVRのブームが来ることが繰り返されています。
舘先生はこの傾向から現在のVRブームが来ることを予言していました。
その理由としては3Dの不完全さが関係していると舘先生が分析していますが、それについては是非講演のPDFを御覧ください。
 
VRが登場したからと言って、もちろん音声、文字、画像、映像による表現が衰退するわけではありません。
ゲームやアダルトなどのエンターテイメントにおいては、一度VRで体験すると戻れなくなる魔力があるので、従来の映像による表現はある程度衰退するかもしれません。
しかし、例えばニュースでは、文字・画像によるインターネット・新聞と、映像によるテレビニュースが共存していて、VRはそれに対する付加的な情報として最初は普及していくでしょう。
映像の発明によって、映画、アニメ、テレビ番組、ゲームなど新しいジャンルが次々と登場したように、VRでも今までにないジャンルが生み出されていくはずです。
そして、VRという情報表現が力を持つにつれ、VRと従来の音声、文字、画像、映像によるメディアを同じデバイスでシームレスに扱うことが急務となり、常に身に着けられるVR/ARデバイスの普及につながっていくでしょう。
 
大衆に普及するデバイスの歴史は、常に情報の進化の歴史とともにあります。
また、普及するデバイスには、情報を伝えたい、手に入れたいという根本の欲求に忠実であることと、既存の手段に飽きることによる新しさの欲求が、常に背景にあります。
20世紀以降、電子的に情報を伝えるデバイスが、手を変え品を変え次々と登場し、普及していきました。
最初は音声だけだったものが、文字、画像、映像を自在に扱うようになり、「誰もが使える」「携帯できる」などの新しい性質を備えて進化していきました。
 
しかし、スマートフォンの登場から10年がたち新しい何かへの欲求が強まる中、情報の性質の進化は限界をむかえ、その進化の方向性はVRという新しい情報表現の普及へと向かうはずです。
そしてVRという新しい情報表現が一般的になる数年後には、誰もが常に身に着けていて、VR、音声、文字、画像、映像を自在に扱えるシースルー型のデバイスが広く普及していくことになるのだと思います。

今後数十年で人間がたどっていく未来の予測

私がバーチャルリアリティ(VR)の会社を立ち上げた理由として、今後数十年で人間はどういう未来をたどっていくのかの予測があります。
 
VRは人間のインプットを乗っ取り、アウトプットを直接読み取る技術です。
 
人間のインプットとは五感や、平衡感覚などの感覚です。
VRというと、Oculus、Viveのようにヘッドマウントディスプレイを使って視覚、聴覚を乗っ取るものを思い浮かべるかと思います。
しかし、触覚などの体性感覚を刺激するデバイスも出ていますし、嗅覚、味覚のVRも重要です。
平衡感覚を直接刺激し、重力、加速度などを錯覚させるデバイスも発表されています。
人間のアウトプットは身体です。
喉を震わせて口で会話し、手で文字を書いたり、頭を動かして別の方向を見たり、また視線や、顔の表情など、人間は身体を使って外界と接するので、それを直接読み取ることが、VRの鍵になります。
 
VRは現実かのように知覚させる技術のことですが、そのために人間のインプットを乗っ取り、アウトプットをそのまま読み取る、つまり人間を直接コンピュータにつなげることの方に本質があると思います。
「VRは人間のインプットとアウトプットを直接コンピュータにつなげるインターフェイスである」と定義をしたいと思います。
そして、今後数十年で人間とコンピュータとの間のインターフェイスの進化はVRに収束すると予測をしています。
 
Pokémon Goのような現実に様々な情報を重ね合わせる拡張現実(AR)は、VRの一種ですが、分けて語られることもあります。
しかし、「人間を直接コンピュータにつなげるインターフェイス 」という観点では、 ARは現実世界を透過して見せるか、完全に没入させるかの違いで、VRデバイスの進化の過程で当然あるべき機能ということになります。
 
VRデバイスは10年もすれば、人間の網膜が読み取れる解像度を超え、普通のメガネと変わらない大きさになり、ARかどうかをシームレスに切り替えられるようになるでしょう。
Leap Motionは5~7年で、以下のような非常に軽量でARかどうかを切り替えることができ、視線を読み取るデバイスが登場すると予測しています。
 

f:id:issaymk2:20160723170038p:plain

視覚のすべてを使ったユーザ体験は何物にも代えがたく、また常に身につけていてポケットから取り出す手間もなくなるわけなので、スマホやPC、テレビ、タブレットなどは、だんだんとVRデバイスに置き換わっていくことになります。
 
しかし、まだこの段階でのVRは不完全です。
視覚はほぼ完全に乗っ取ることができますが、それ以外の感覚、特に触覚などの体性感覚を乗っ取るのは難しく、キーボードのような物理デバイスなしにボタンを押す圧力感覚を完全に得るのは難しいです。
視線や手の動きを読み取ったコンピュータへの入力は不自由さが残りますし、声を出して入力するのは面倒くさく、どんな状況でもできるわけではありません。
そうなると、必然的に、脳を直接読み取ってコンピュータに入力し、脳に直接作用して感覚を自在に操るような進化を遂げるでしょう。
 

f:id:issaymk2:20160723174938j:plain

 
シンギュラリティという言葉を提唱したレイ・カーツワイルは、2030年代には、数十億個のナノマシンを脳内に挿入し直接脳を読み取り、VR空間を生成できるようになると予測しています。
ナノマシンはすでに癌の治療にも応用されていて、決してSFの話ではなく、現在の基礎技術の延長にある、時間が解決する問題です。
そして、技術の加速度的な進化を考えると、もしかしたらあと十数年後には実現しているかもしれないのです。
人間の脳は、VRという究極のインターフェイスを通じて直接コンピュータにつながり、人間の能力は飛躍的に向上することになります。
 
では、シンギュラリティでよく引き合いに出される人工知能(AI)はどういう役割を果たすのでしょうか?
コンピュータは計算する機械という意味ですが、それを使う目的はもともと人間の知的作業を担うことです。
最初は記憶や計算など人間の知能の一部しか担えなかったものの、金融取引、インターネット広告の表示・入札、商品のリコメンデーション、医療診断、クレジットカードの不正検知、など高度な知的判断が必要なシーンの多くにコンピュータが使われるようになってきました。
狭義のAI、つまり人間の知能のすべてを模倣し、完全に自律的に動くAIがどこまで必要かという議論は一旦置いておきます。
しかし、今後あらゆる知性が必要とされるシーンにコンピュータが使われるようになってきますので、コンピュータは単に計算する機械という名前より、AIと呼んだ方がしっくり来るようになるでしょう。
人間の脳がVRを通して直接コンピュータにつながる未来は、人間の脳がVRを通して直接AIにつながる未来と言い換えることができると思います。
 
では、人間の脳がVRでAIに直接つながるとどうなるのでしょうか?
実際に旅行に行かずとも、その土地の風や匂いなどをそのまま体感できますし、
歴史上のある時点にタイムスリップして、出来事を追体験することもできますし、
栄養食を口に入れただけで、一流のシェフが作った料理を食べたかのように感動することができます。
またAIは人間の知能をはるかにしのぐようになるわけなので、AIが作ったゲーム、映画などのコンテンツは人間の想像の範囲をはるかに超え、ただただ感動をするしかありません。
また、ある人が感動した体験をそのまま別の人に追体験させることができますし、その体験をデータとして保存することができます。
ある人の脳もそのままデータで保存でき、あらゆる時間、空間で再現できるわけなので、不死を手に入れたとも言えるでしょう。
当然、多くの倫理的な課題が生まれますが、それらは悪意を持ったAIが人間を滅ぼす可能性よりも、喫緊で根源的な問題として人類に課せられることになります。
 
VRを突き詰めると、人間とは何で、どういった形に進化していくかということなのです。