2020/04/20 未分類
データサイエンス初心者の妄想①
『戦略的データサイエンス入門』(オライリー・ジャパン)を先日から読み進め、分かってきたことがあります。
機会学習とか深層学習といった諸々の最先端テクノロジーというのは何かしら特別な人しか操ることができない、とても遠くにあるもの
だと思っていたのですが、実はとても地道で、一つ一つの作業を積み上げて完成するピラミッドのようなもの。
データをたくさん集めて、それを使えるようにするだけでも地道で大変な作業。「たくさん」というのは曖昧な表現ですが、精度や解像度を上げるためには膨大な数を求められます。
IT素人の私は想像の中で、機械学習にしても深層学習にしても、集めたデータをマルっと放り込めば自動でほしい情報だけ抽出してくれる仕様になっているものだと思っていました。
料理でいうと材料を大きな機械に放り込むだけで、スープが完成するイメージ。
実際は野菜の泥を洗い流し、作る料理にあった下処理を施して、そこから独自に考えた調理法により料理を完成させるんです。
ただ、料理の下処理専用の機械があるのと同じで、データを目的に応じて使えるものにするツールも作れるのではないかと勝手に想像しています。
AIは「自分で考えて学習する」機能を持つのですから、人間のように「こんな料理を作るためには、材料はこんな風に下処理する」というようになる気がするのです。
妄想現場からは以上です。