内容説明
マテリアルズインフォマティクスは物質科学においてデータから知識を抽出する科学である。その科学的ワークフローを行う具体的な実践手法としては、Rや近年Pythonの計算機言語による手続き記述がよく用いられる。しかし、計算機言語を用いるにはまず計算機言語を習得せねばならない。従って、機械学習手法を用いたデータマイニングを実践するには計算機言語をまず学ばねばならないことになる。これらの計算機言語を用いずにGUIを用いて科学的ワークフローの設計を行えるスタンドアロンソフトがあり、Orange Data Miningはそのうちの一つである。本書は習うより慣れろという方針で作成しており、機械学習手法をなるべく数式を用いずに説明し、主として無機物質科学の小規模データを題材として機械学習を用いたデータマイニングの初歩を紹介する。理論の詳細な説明より、なるべく多くの例を掲載し何ができるのかを体験することを目的とする。
目次
1 Orange Data Miningとは
2 機械学習の基礎概念
3 超基礎:簡単な観測データからの回帰モデルの学習
4 基礎:希土類コバルト二元合金のキュリー温度の予測回帰モデルの学習
5 基礎:単体元素基底状態結晶構造の予測
6 基礎:鉄結晶構造のクラスタリング
7 応用:文字分類モデルの学習(文字認識)
8 応用:トモグラフ像の復元
A 付録
著者等紹介
木野日織[キノヒオリ]
1991年東京大学理学部物理学科卒。1996年東京大学大学院理学系研究科博士課程卒(理学博士)。1996年東京大学物性研究所物性理論部門助手などを経て2002年から(国)物質・材料研究機構に勤務する。2015年からの国立研究開発法人科学技術振興機構(JST)イノベーションハブ構築支援事業の一環として(国)物質・材料研究機構に情報統合型物質・材料開発イニシアティブ(MI2I)発足時からデータマイニングを行う。データ駆動AIでは物性物理の知識を活かした説明・解釈可能なAI技術、第一原理計算によるデータ生成、そのための知識駆動AI技術などに興味を持つ
ダム,ヒョウ・チ[ダム,ヒョウチ] [Dam,Hieu‐Chi]
1998年東京大学理学部物理学科卒。2003年北陸先端科学技術大学院大学材料科学研究科物性科学専攻博士号。2005年10月から北陸先端科学技術大学院大学知識科学研究科講師。2011年4月から同テニュア付准教授。2020年10月から北陸先端科学技術大学院大学知識科学系教授。学位は材料科学で取得。2005年から材料科学とデータマイニングの融合に身を投じている。専門分野は材料科学、知識科学、計算材料科学、データサイエンス、マテリアルズインフォマティクス。データ駆動型アプローチを用いた知識抽出など、証拠理論を用いた類似度評価に興味があり、材料科学研究のための説明・解釈可能なAI技術の開発に取り組む(本データはこの書籍が刊行された当時に掲載されていたものです)
出版社内容情報
非プログラマのための機械学習ソフト Orange!
物質科学・化学工学の研究開発に変革をもたらす技術として「マテリアルズインフォマティクス」が期待され、各分野でその取り組みが急速に進んでいる。
しかし機械学習を用いたデータマイニングである性質上、まずはプログラミング技術を習得しなければいけない実情がある。
本書ではGUIベースのフリーソフト「Orange Date Mining」を使用し、プログラミングを学んでいない人でも機械学習を実践する手法を紹介している。
著者によるサンプルスクリプトとデータファイルも準備しているため、手を動かし理解しながら読み進めることができる。
また各章の練習問題を解けば技術がより身につく構成となっている。マテリアルズインフォマティクスをこれから始める方に最適の一冊。