コンピュータの性能が飛躍的に向上する中、いよいよ人間の労働力が脅かされるのでは...といった視点含め、急速に注目が集まる人工知能・AI。
SONYの犬型ロボットAiboやSoftbankのPepperがかわいいなんて悠長なことを言っていられる状況ではないようにも見受けられますが、現状は、どんな感じなのでしょうか?
数年前から工場ではアーム型ロボットが、倉庫では、カート型とでもいうのかロボットによる自動化が進み、ロボティクスなどと言われていますし、ここ1〜2年でスマートスピーカーが登場、これにはAIが搭載され、言葉を発するとネット検索した結果や天気予報、日付時刻なども教えてくれたり、スマートリモコンも組み込まれ、声で家電操作もできるなど優秀極まりありません。
この流れは、明らかに人間を意識して人間の代わりをしてくれる限りなく、人間に近いものを目指している一環と言っても過言ではないでしょう。
人間には、五感がありますが、OpenCVなどによる画像・映像認識技術は、人間の目を、テキスト文書などを読み上げることができるeSpeak、Festival、Mbrola、Open JTalkなど音声合成技術は、人間の声・口を、音声をテキストに変換するJuliusは、人間の耳を、イチゴの収穫さえもできてしまうアームロボットは、擬似的な人間の触覚を、また、既に匂いを嗅ぎ分ける技術も開発中で完成間近と言われています。
これらには既に人間の頭脳にあたるAIが組み込まれており、学習を積み重ねることで多少違う画像・映像やちょっと違う言葉でも読み替えてくれたりする柔軟性すら持ち合わせています。
よって機能だけで言えば、人間っぽいものを造るハードウェアとソフトウェアは、既にできているとさえ言えるでしょう。
一口にAIと言っても、これを実現する技術については、機械学習(マシンラーニング)の内、特にニューラルネットワークが今、最も注目されています。
機械学習の中には、とにかく解になり得る情報を全て教え込んでおくものもありますが、人間の脳の仕組み(ニューロンやシナプスなど)を模したニューラルネットワークは、より正確な判断を促すためにはそれ相応の情報量が必要とは言え、全て教え込まなくても自己学習していく、与えられた情報が不完全でも補完できたり、曖昧でも「これと似てるから、たぶんあれ」という推測ができ、補正や良質な情報の増加によって益々精度が上がっていくという点が、大きな理由の1つと言えるでしょう。
ニューラルネットワークには、主に畳み込みニューラルネットワークと言われるCNN/Convolutional Neural Network、多層型のDNN/Deep Neural Network、再帰型のRNN/Recurrent Neural Networkなどがあり、多層の畳込みニューラルネットなどもあるようです。
中でもDNNによる機械学習は、ディープランニング(深層学習)として知られています。
そう、人間同様、学習能力があり、学習・経験することで更に頭がよくなったり、柔軟になったりしていくのです。
学習の仕方や経験、その質によって良くなることも悪くなることもあるのも人間と同じ...。
なんと1940年代には、人工知能という言葉が生まれ、研究されていたというのですが、あのバブル期ですら不足していたリソースも飛躍的なコンピュータの発達、低コスト化、IoTの浸透、クラウドやSNSの登場、市場形成により多大な情報(ビックデータ)を取得できる環境が整ったことによって近年、今までにないほど急速に進歩し、様々な分野で実用化も進んでいます。
フリーやオープンソースのニューラルネットワークのフレームワークとしては、TensorFlow、Keras、CNTK、Theano、Caffe/Caffe2、TorchやChainerなどがあるようです。
気づけば、更に汎用的で先進的なAGIの研究も進んでいるそうです。