シラバスの詳細な内容を表示します。
→ 閉じる(シラバスの一覧にもどる)
開講年度 | 2023 年度 | |
---|---|---|
開講区分 | 共通教育・教養基礎科目 | |
受講対象学生 |
学部(学士課程) : 2年次, 3年次, 4年次, 5年次, 6年次 |
|
授業科目名 | データサイエンスIII | |
でーたさいえんすさん | ||
Data Science III | ||
授業テーマ | データ解析と統計 | |
単位数 | 2 単位 | |
受講対象学生 |
学部(学士課程) : 2年次, 3年次, 4年次, 5年次, 6年次 2022年度以前入学生用の科目 ※ 過去に「現代科学理解特殊講義」が単位認定されている場合、重複履修の申請が必要です。履修案内を確認の上、教養教育事務室へ申し出て下さい。 |
|
授業科目名 | 現代科学理解特殊講義 | |
げんだいかがくりかいとくしゅこうぎ | ||
Lecture Course in Understanding Modern Sciences | ||
授業テーマ | データ解析と統計 | |
単位数 | 2 単位 | |
ナンバリングコード | ||
開放科目 | 非開放科目 | |
分野 | 環境・科学 | |
分類・領域 |
教養統合科目・現代科学理解 (2022(令和4)年度〜2015(平成27)年度入学生対象) |
|
開講学期 |
後期 |
|
開講時間 |
木曜日 5, 6時限 |
|
授業形態 |
対面授業 * 状況により変更される可能性があるので定期的に確認して下さい
「オンライン授業」・・・オンライン会議ツール等を利用して実施する同時双方向型の授業 |
|
開講場所 | 数理・データサイエンス館 (CeMDS館) 2F [Google Map]https://goo.gl/maps/xAByQFySa2hk6od58 (受講者数が多い場合、開講場所を変更する場合があります) |
|
担当教員 | ○白井伸宙(総合情報処理センター) | |
○Nobu C. Shirai | ||
SDGsの目標 |
|
|
連絡事項 | * 状況により変更される可能性があるので定期的に確認して下さい |
授業の概要 | 研究室で取り組む研究で必要となるデータの取り扱い・解析のうち、研究分野に依存しない基礎的な事項を学ぶ。 |
---|---|
学修の目的 | データが与えられた時、以下の事項ができるようになること。 ・データが集められた目的・方法などの背景情報を把握する ・データを計算機が処理しやすい形式に整える (整然化; tidying) ・統計プログラムにより基本的な統計量を算出し、データの質・内容を理解する ・グラフィカルユーザインタフェース (GUI) とコマンドラインインターフェース (CLI) のそれぞれの利点を理解し、用途に合わせてツールを使い分ける ・ノートブック形式のファイルを利用することで、データの処理や統計解析を説明文書とともに再現可能な形で提示する方法を知り、実践する ・常に解析の誤りを疑い、誤りが生じたことに気づけるよう備える ・データからどのような情報を引き出すことができるかを検討する ・同種かつ未知のデータに対し、値や分類を推測する数理モデルを1つ以上構築することができる ・構築した数理モデルを評価する方法について説明できる ・データから得られた情報にはどのような応用先があるか、どのような主張が可能かを考察する 自らデータを収集し記録する際に気を付けるべき以下の事項を把握すること。 ・人と機械の両方が読み取りやすく再利用がしやすいようにデータを整える ・可読性・再利用可能性を損なうデータの記録方法とその理由について把握する |
学修の到達目標 | 未知のデータを与えられた時、その中身を理解するための具体的な手続きを想起し、臆することなくデータと向き合う事ができるようになる。 具体的な手続きの例: ・データについている説明書きを読む ・テキストエディタや表計算ソフトで中身のデータを眺める ・統計解析ソフトのコマンドを用いてデータ処理の過程をプログラムで実装し、人為的なミスを減らす工夫をする ・複数の解析手法を用いて同じデータを多面的に捉え、互いに矛盾がないかを確認することで、解析に誤りがないか確認する ・次にどのような出力が得られるかを解析の各過程で予想する ・想定外の結果が得られた場合に解析の誤りを疑い、解析に誤りがないことがある程度立証できた場合には、データ自体の誤りを疑う |
ディプロマ・ポリシー |
|
成績評価方法と基準 | 毎回の授業前後に出題するレポート: 60% 中間・期末レポート: 40% |
授業の方法 | 講義 演習 |
授業の特徴 |
反転授業 |
授業改善の工夫 | ・対面で行う授業を録画し、授業後に再度受講できるようにアーカイブ動画を準備する。 ・Google Classroom経由で授業内容に関する質問や授業の進行に対するコメントを受け付け、授業の進行スピードを調節する。 |
教科書 | 江崎貴裕『分析者のためのデータ解釈学入門 データの本質をとらえる技術』ソシム (2020) http://opac.lib.mie-u.ac.jp/opc/recordID/catalog.bib/BC04485205 ※ 赤色のカバーの本。参考書に指定している姉妹書の『数理モデル入門 』とタイトルが似ているので注意。 |
参考書 | 江崎貴裕『データ分析のための数理モデル入門 本質をとらえた分析のために』ソシム (2020) https://opac.lib.mie-u.ac.jp/opc/recordID/catalog.bib/BB30526175 ※ 黄色のカバーの本。教科書に指定している『データ解釈学入門』の姉妹書。 Steven S. Skiena 著、小野 陽子 監訳、長尾 高弘 訳『データサイエンス設計マニュアル』オライリー・ジャパン (2020) https://opac.lib.mie-u.ac.jp/opc/recordID/catalog.bib/BB29620642 ※ 以下のリンクから原著者のSteven S. Skiena氏による講義動画、講義資料を閲覧できる。 https://www3.cs.stonybrook.edu/~skiena/data-manual/lectures/ |
オフィスアワー | 木曜日 12:00〜14:00; 14:30~15:30 (授業前後の時間) |
受講要件 | |
予め履修が望ましい科目 | データサイエンスI、データサイエンスII |
発展科目 | |
その他 |
以下に白井が担当した授業の例を示す。講義の進め方、レポートの出題方法など、参考になる所があるかもしれない。 -- ・情報工学科3年生向け『数値解析』 (2020年度) https://youtube.com/playlist?list=PL6NMQgXuN9innnY7_yVT5ZJ7tE_oqeQH6 |
MoodleのコースURL |
---|
キーワード | データサイエンス、データ解析、統計 |
---|---|
Key Word(s) | data science, data analysis, statistics |
学修内容 | 第01回 データの観察法 第02回 データ解析に潜む罠 第03回 データに含まれる誤差とバイアス 第04回 相関関係と交絡因子 第05回 データ収集の計画法 第06回 データの整然化 第07回 データ分析の自動化と再現性 第08回 記述統計量と統計分布 第09回 探索的データ分析 第10回 確証的データ分析 (統計検定) 第11回 多変量データの解析 第12回 数理モデルの基礎 第13回 応用志向型モデリング (機械学習) 第14回 数理モデルの評価 第15回 データの可視化 |
事前・事後学修の内容 | 授業開始までに提出する簡単な課題と授業後に提出する課題があります。 |
事前学修の時間:90分/回 事後学修の時間:150分/回 |