【東大が公開している教材見てみた】社会におけるデータ・AI利活用-1-1. 社会で起きている変化-

ツイッターでリンクが回ってきた、「数理・データサイエンス・AIリテラシーレベル教材」とやらを読んでみた。

www.mi.u-tokyo.ac.jp

まずは、導入の「1-1. 社会で起きている変化」に目を通してみて、思ったことをつらつらと書いてみた。

http://www.mi.u-tokyo.ac.jp/consortium2/pdf/1-1_literacy_level_note.pdf

でーたさいえんすってなんだー?

『データを有効活⽤し、数理モデリングや計算技術と適⽤ドメインの専⾨知識を結合することで新たな知識を⽣み出し、その活⽤のシナリオを導き出すことです』

f:id:fk1jp:20200512222907p:plain

自分なりにかみ砕いて説明してみると、文中にあるケプラー法則の例をとると

『データを有効活⽤し』

ティコ・ブラーエおじさん : ずーっと星の動きを観察してて、とりあえずいっぱいデータはある!だけどなんか円軌道から逸れて星が動いている。なんで!よくわからん!データあげるからケプラー調べて!
ケプラーさん : はーい。この日はここで、あの日はそこなんだね~。

『数理モデリングや計算技術と適⽤ドメインの専⾨知識を結合することで新たな知識を⽣み出し』

ケプラーさん : あれ、この周期、楕円じゃね?太陽の位置が中心じゃなくて焦点じゃね?

『その活⽤のシナリオを導き出すことです』

その後、いろんな天文学者 : ケプラーの法則助かるわ~。いろいろ辻褄があってるから研究進めやすいわ。
ニュートンさん : あれ、僕の運動方程式と惑星の楕円軌道で万有引力導けるじゃん!

という風に、「ブラーエさんがデータを集めて」「ケプラーさんが調べて法則を見つけ」「いろんな天文学者ニュートンさんが活用する」という流れで、過去の偉人たちはデータから法則を導いてきました。

それがなぜ今、注目されているかというと

データサイエンスがはやる理由

パソコンが強くなってきた。

ケプラーさんが地道に手で計算していたことが、現代のCPUやGPUではまさに天文学的なスピードで計算できるようになって、様々な法則を見つけやすくなり

それで得た法則をさらに活用して、様々な場合を試して別の分野などの法則を見つけることができる。

データが一杯有るし、一杯集まる。

ブラーエさんが手で長年星の位置や情報を集めていましたが、現代では毎秒単位で様々な情報を集められるし、データはある程度パソコン君が勝手に処理できるような形になっている。

POS情報などからも様々な情報が得られ、有名な話ではビールとおむつが良く一緒に買われているところから、店舗のレイアウトの改善につながったなど、ザ学問というところ以外でも活用されています。

様々な科学での応用

データ活用をするにあたり、膨大な数のパターンマッチと検証ができることが強みですので、それが生きる個所で使われていますね。

物理学では、膨大な観測データから太陽系外惑星がないか調べたり

www.dailybreak.co

化学系では、複雑なたんぱく質の構造をデータにして解析したりなど。

その他、活用はpdf見てください。

AIとデータサイエンス

現在、AIは完ぺきではなく、与えられた問題に対してかなり高い精度(100%ではない)で回答できる「特化型AI」しかありません。

対義語として「汎用AI」というものがありますが、これはどんな問題でもある程度の精度で回答できる、いわゆるドラえもんのようなものです。

データサイエンティストは、この特化型AIを必要な場所に組み込んだり、大量のデータからケプラーのように法則を見つける人になります。

データを起点としたものの⾒⽅

今まで話してきた、AIやデータを起点としたものの見方っていうのは、いわゆる「直観」で判断することに等しいです。

どういうことかというと、AIっていうのは基本的に「1+2」と言われて必ず「3」と返すような、「関数」的な機能は持っていません。
(もちろん、AIに関数を組み込んで「XXというインプットがあればYYと返しましょう」と仕組むことは可能ですが、それはデータを起点としたモノの見方とは少し違うように思います。)

ただし、人間でもそうですが直観での反応は、先入観や誤った反応を起こす可能性もあり、そのあたりをコントロールするのもデータサイエンティストの仕事であったり、人々がデータサイエンスを理解し判断する基準にもなるのかなーと思います。

助動詞

今日は文法問題を解いていた際に気になった、助動詞について調べてみました。

助動詞とは

動詞に意味を与える動きを持つもので助動詞の後ろは動詞の原形

問題で使われるポイント

文型がおかしい

動詞の原形じゃない

すごいベーシックな問題です。

例えば

You can [ ] my pen.
1. use
2. used
3. using

などですね。

人称がおかしい

これは、問題文内に助動詞が含まれないパターンです。

She [ ] very well.
1. swim
2, can swim
3. swimming

ここだと、普通に動詞も入りますが、1だと三人称単数のsが抜けているため利用できない。など。

副詞が挟まれる

これは、助動詞と動詞の間に副詞が挟まって、動詞の扱いを誤ってしまうことが多いそうです。

We will significantly [ ] plastic bottle litter.
1. reduces
2. reduce
3. be reduced

時制

あと、気になったのは時制です。
could や would はそれぞれcanやwillの「過去形」とならいますが、どちらかというと「なんらかの遠さ」を表しているようです。(下記リンク参照)

He [ ] there yesterday.
1. couldn't be
2. can't have been

答えは2のようです。

taruo.hatenablog.com

雑メモ

will は強い意志

may not は禁止

もろもろの意味とかはリンク先で studysapuri.jp

【時事】チバニアンについて

「2020年3月増刊号 最新時事用語&問題」 から、気になったことを書いていこうと思います。 Amazon CAPTCHA

今日は「社会・生活 3」の「チバニアンが正式決定」をちょいと調べてみます。

概要

2017年11月13日、千葉県市原市で発見された地層に対して、日本で初めて地球の歴史を表す「時代区分」の国際基準候補となった。

scienceportal.jst.go.jp

2020年1月、チバニアン(Chibanian、千葉時代)に決定した。

チバニアンの特徴

77万年前に地磁気の逆転が起こったことを示している。

地磁気の逆転は11回起こったとされていて、その最後の逆転がチバニアン(チバ紀)に発生したことを、千葉にある地層が よく示している。

地質年代とは

約46億年前の地球の誕生から現在までの内、直近数千年の記録の残っている有史時代(歴史時代)以前のことで地質学的な手法でしか研究できない時代の事。

ja.wikipedia.org

世界史の勉強でも学んだ、いわゆる先史についての研究対象ですね。
時代的にはネアンデルタール人などの、旧人が生息していた時代のようで、更新世なので少し今より寒いのでしょうね。

fk1.hatenablog.jp

他にも、ジュラ紀もフランス東部からスイス西部に広がるジュラ山脈の広範囲に分布する石灰岩層にちなみ、1829年にアレクサンドル・ブロンニャールにより提唱された。

ジュラ紀 - Wikipedia

【mundi先生】世界史20話プロジェクト003 メソポタミア文明

前回の続きから動画を見ていきます。

www.youtube.com

オリエント世界とは

オリエント = (ヨーロッパから見て)太陽の登るところ
現在の西アジア、中東を指す。

オリエントの5つの土地

http://historiagakuen.net/fd/wp-content/uploads/2015/06/オリエント1.png 引用 : 2時限目:オリエント世界 | ヒストリア学園高等学校 世界史B

メソポタミア文明

メソポタミア 「川の間の土地」のこと
ティグリス川とユーフラテス川に挟まれた(周辺)の地域

シュメール人

文字(楔形文字)の使用
年度版に茎や枝を押し付けて形を作る文字

楔形文字

メソポタミア南部に都市国家を建設←文字があるからわかる!

神権政治 : 各地にジッグラト(聖塔)

塔ってあるけど、見た感じ平べったいピラミットって感じ。

world-note.com

アッカド

シュメール人を制服し、都市国家から統一国家の形にした。
メソポタミア初の統一国家 サルゴン一世(歴史上一番古い個人名かも)

学問のすゝめ 三編 一人輪読会

学問のすゝめの三編を読んだので、自分なりに読み取ったことや読んだ感想をまとめて見た。

読んだのは青空文庫のものですが、段落については原本(慶應義塾)を参考にしています。

要約

[国は同等なること]

国と国が独立し対等であるべき。そのためにも国民の努力が必要。

国家間には、武力や財力など貧富の差があるものの、それぞれの国には権理は保証されるべきである。
そのためには、国民一人一人がそれぞれ一身の独立をし、学ぶことから始めよう。

これには、当時の時代背景が色濃く影響している模様。

開国当初、国レベルでは英米からの不利な条約の締結や、企業レベルでも不利な取引が行われていた。
この状態に不条理を感じて個々人レベルからしっかり学び、たとえ相手が列強国だとしても正当な権利を理解して、道理に外れる無理を飲まないようにして欲しかったんだろう。

『学問のすすめ』現代語訳9 日本屈辱の歴史である不平等条約は頭が弱いから押し付けられた - 平田 圭吾のページ

[一身独立して一国独立すること]

第一条 独立の気力なき者は国を思うこと深切ならず。

責任感のない人(「独立」していない人)が増えてしまうと、たとえ頭数が多くとも実際の国力はそれよりもかなり小さいものになってしまう。

平時であれば、100万人のうち1000人(文中では「主」と表現)が責任感を持ち、残り99万人余り(文中では「客」と表現)に指示を出し客は言われるがままに責任感を持たずに国を回していたとしても、何も問題はない。 (このことを「主客」の二様と表している)

この状態で他国との争いになった際には、責任感のない99万人余りは我が身可愛く命までははらず役に立たず、一国の独立はできないわな。と。

だからこそ、国家と国民の間で上下関係は無く、国家は行政を行い、国民は納税をした上で自己の権利を訴えつつ受益するという、双方の持ち場を分けているだけである。
そして、我が国を我が家のように思えるようになれば、国力は強くなっていくであろう。

この辺りも、やはり時代背景が大きいですね。

開国前は「幕府」が全てで、それ以上が存在しない状況であったため(前編でも記載はあったが)お上に従えば良いという考えが蔓延していたため、所謂「客」ばかりだったんでしょう。
そして、開国当時の列強国によくあしらわれていて国益が損なわれていたことが諭吉さんは問題視してたんでしょう。

『学問のすすめ』現代語訳10 人頼みの責任転嫁が国をダメにする - 平田 圭吾のページ

第二条 内に居て独立の地位を得ざる者は、外にありて外国人に接するときもまた独立の権義を伸ぶること能わず。

これについては、国レベルだけでなく個人レベルや企業レベルであったとしても、「独立」の心持ちがなければ外国人に無理を言われて食い物にされて、それは回り回って国益を損ない、言っちゃえば国辱だよとのこと。

んで、「独立」の心持ちってのは外国人相手にってだけじゃ無くて、お上にへこへこしたり士農工商の上下関係をただ鵜呑みにして思考停止しているような、国内の事象でもちゃんと「独立」の心持ちで行動しような。と。

『学問のすすめ』現代語訳11 卑屈をやめて一人でも立ち上がること - 平田 圭吾のページ

第三条 独立の気力なき者は人に依頼して悪事をなすことあり。

これは、独立の心持ちがない人は、誰かの名を利用して悪事を働くこともある。ということを表している。

文中では、大名の名を借りて高利貸しを行うものの話があり、これが外国の名を借りた同様の悪事があった場合は正に国難であり売国となり、目も当てられないことになる。

『学問のすすめ』現代語訳12 虎の威を借る狐ーー国民の主権を盗む政治家 - 平田 圭吾のページ

学問のすゝめ 三編 分からなかったり気になった単語

前回 に引き続き、今回は三編を読んで分からなかったり、気になった単語を調べてみた。

権義

二章でも出てきた権理通義の略称。
英語におけるrightとのことですが、それだと権理じゃなくて「権利」ではと思い調べてみました。

mag.japaaan.com

権「利」だと利己的な意図が強く、公共の福祉を満たす「理」に叶った権限であるべきという気持ちも入っているよう。

厘毛の軽重あることなし。

「厘毛」自体がほんの少し、を意味しており、(西洋富国の富強には及ばないが、一国の権義に)ほんの少しの軽いも重いもない。という形で使われています。

曲を蒙る

きょくを「こうむる」や「こうぶる」と読みます。被ると同じようです。

意味としては、無理難題を押し付けられるという意味のようです(調べてみても詳細な語の説明は見つかりませんでした。)

曲 は現代語でもある「まがったこと」の意味が入っているのでしょうか。

慥かにして

たしかにして、と読む。確かにと同じようです。

「わが日本国人も今より学問に志し気力を慥かにして、まず一身の独立を謀り」とあるので、学問を志して気力をつけて自立しましょうっていう意味でしょうか。

悉皆

しっかいと読み、「一つ残らずことごとく全て」という意味。確かに「悉く」の漢字が使われている。

諛う

へつらうと読み、人の気に入るように振る舞う。また、お世辞を言うことです。

所謂「媚びへつらう」のへつらうで、下手に出ることですね。

dictionary.goo.ne.jp

一言半句

一言やちょっとした言葉を指し、「一言半句もおろそかにしない」など良い使われかたもありますが、本文では「目上の人に逢えば一言半句の理屈を述ぶること能わず、立てと言えば立ち、舞えと言えば舞い、その柔順なること家に飼いたる痩せ犬のごとし。」と、なかなかの言われようw

dictionary.goo.ne.jp

名目金

当時の貸金のことのよう。

kotobank.jp

ゼロから学ぶディープラーニング(私は既習)パーセプトロン

今日は、みんな大好きオライリーから、ゼロから学ぶdeeplearningから、第2章パーセプトロンについて勉強メモを残してみようと思います。

www.oreilly.co.jp

なお、1章はPythonの基本的な使い方や説明だったので(これはこれで面白かったですが)割愛します。

(ちなみにですが、タイトルにある通り私はこれ勉強したことありますし、なんなら大学の卒論がこれでしたので復習の意味も込めてという形になります。)

パーセプトロンとはなんぞや。

パーセプトロン(perceptron)とは、人間のニューロンをモデルに作られたアルゴリズムです。

rightcode.co.jp

ニューロンとはなんぞやというと、脳味噌の各機能の構成単位みたいなものです。 例えば、りんごを見たときに網膜に写った画像に対して、電気信号を人の脳にあるニューロンたちが処理をして、りんごであると認識できるようにしています。

上記ブログでも記載がある通り、パーセプトロンは受け取った信号に対して、それぞれに重み付けをした上の情報を見て出力を変更します。

簡単にパーセプトロンを説明しようと思います。

例えば、りんごを見て反応するパーセプトロンがあるとします。
そのパーセプトロンは「赤色」というインプットに対しては強く反応すべきですが、「丸くない」という情報には逆に『りんごじゃないぞー』と、マイナス方向に反応しなければなりません。
また、りんごを持っているであろう「人の手」というインプットに強く反応する必要も反対する必要もありません。

そのようにインプットに対して「重み付け」して、合計の信号の強さがとある「閾値(バイアス)」を超えた際に反応するものがパーセプトロンです。

論理回路パーセプトロン

パーセプトロンが何故取り上げられているかというと、それ自体で単純な論理回路になっているからです。 (ディープラーニングはこのパーセプトロンを大量に重ねたりつなげたりしたものになります。)

例えば、AND回路とかもパーセプトロンで作成できます。

AND回路といえば、0か1の入力が二つあった際にどちらも1であれば1を出力するもので、それもパーセプトロンで計算できます。

イメージとして分かりやすいものは、線を引いて1となる空間がどこで、0となる空間はどちらかをみることです。

参考ページ

AND回路とか分からない人はここでも見てみてください。 sagara-works.jp

多層パーセプトロン

パーセプトロン単体で論理回路が作れることは分かったけど、線形分離不可能なXORについて、パーセプトロンを多層に積んで解決することができます。

XORは、最初の入力をNANDとORのパーセプトロンにツッコミ、その出力をANDパーセプトロンに突っ込むことで表現できます。

ここから、パーセプトロンを多層化することで線形分離不可能な難しい問題も解けるようになります。

実際、現代のコンピュータのCPUもNAND回路の集積でできていたりと、身近な箇所でパーセプトロンの基本的な考え方が利用されています。

終わりに

次はニューラルネットワーク。ぱっと見で懐かしさがあって楽しみ。勉強進めよう。