ツイッターでリンクが回ってきた、「数理・データサイエンス・AIリテラシーレベル教材」とやらを読んでみた。
まずは、導入の「1-1. 社会で起きている変化」に目を通してみて、思ったことをつらつらと書いてみた。
http://www.mi.u-tokyo.ac.jp/consortium2/pdf/1-1_literacy_level_note.pdf
でーたさいえんすってなんだー?
『データを有効活⽤し、数理モデリングや計算技術と適⽤ドメインの専⾨知識を結合することで新たな知識を⽣み出し、その活⽤のシナリオを導き出すことです』
自分なりにかみ砕いて説明してみると、文中にあるケプラー法則の例をとると
『データを有効活⽤し』
ティコ・ブラーエおじさん : ずーっと星の動きを観察してて、とりあえずいっぱいデータはある!だけどなんか円軌道から逸れて星が動いている。なんで!よくわからん!データあげるからケプラー調べて!
ケプラーさん : はーい。この日はここで、あの日はそこなんだね~。
『数理モデリングや計算技術と適⽤ドメインの専⾨知識を結合することで新たな知識を⽣み出し』
ケプラーさん : あれ、この周期、楕円じゃね?太陽の位置が中心じゃなくて焦点じゃね?
『その活⽤のシナリオを導き出すことです』
その後、いろんな天文学者 : ケプラーの法則助かるわ~。いろいろ辻褄があってるから研究進めやすいわ。
ニュートンさん : あれ、僕の運動方程式と惑星の楕円軌道で万有引力導けるじゃん!
という風に、「ブラーエさんがデータを集めて」「ケプラーさんが調べて法則を見つけ」「いろんな天文学者やニュートンさんが活用する」という流れで、過去の偉人たちはデータから法則を導いてきました。
それがなぜ今、注目されているかというと
データサイエンスがはやる理由
パソコンが強くなってきた。
ケプラーさんが地道に手で計算していたことが、現代のCPUやGPUではまさに天文学的なスピードで計算できるようになって、様々な法則を見つけやすくなり
それで得た法則をさらに活用して、様々な場合を試して別の分野などの法則を見つけることができる。
データが一杯有るし、一杯集まる。
ブラーエさんが手で長年星の位置や情報を集めていましたが、現代では毎秒単位で様々な情報を集められるし、データはある程度パソコン君が勝手に処理できるような形になっている。
POS情報などからも様々な情報が得られ、有名な話ではビールとおむつが良く一緒に買われているところから、店舗のレイアウトの改善につながったなど、ザ学問というところ以外でも活用されています。
様々な科学での応用
データ活用をするにあたり、膨大な数のパターンマッチと検証ができることが強みですので、それが生きる個所で使われていますね。
物理学では、膨大な観測データから太陽系外惑星がないか調べたり
化学系では、複雑なたんぱく質の構造をデータにして解析したりなど。
その他、活用はpdf見てください。
AIとデータサイエンス
現在、AIは完ぺきではなく、与えられた問題に対してかなり高い精度(100%ではない)で回答できる「特化型AI」しかありません。
対義語として「汎用AI」というものがありますが、これはどんな問題でもある程度の精度で回答できる、いわゆるドラえもんのようなものです。
データサイエンティストは、この特化型AIを必要な場所に組み込んだり、大量のデータからケプラーのように法則を見つける人になります。
データを起点としたものの⾒⽅
今まで話してきた、AIやデータを起点としたものの見方っていうのは、いわゆる「直観」で判断することに等しいです。
どういうことかというと、AIっていうのは基本的に「1+2」と言われて必ず「3」と返すような、「関数」的な機能は持っていません。
(もちろん、AIに関数を組み込んで「XXというインプットがあればYYと返しましょう」と仕組むことは可能ですが、それはデータを起点としたモノの見方とは少し違うように思います。)
ただし、人間でもそうですが直観での反応は、先入観や誤った反応を起こす可能性もあり、そのあたりをコントロールするのもデータサイエンティストの仕事であったり、人々がデータサイエンスを理解し判断する基準にもなるのかなーと思います。