SQC
セミナー受講レポート:「モノづくりにおける問題解決のためのデータサイエンス入門コース」<2022年02月22日>
2021年11月29日(月)~12月1日(水)に東京・日科技連・東高円寺ビルで「第2回 モノづくりにおける問題解決のためのデータサイエンス入門コース」をライブ配信にて開催しました。
多数のご参加を賜りました本セミナーに、
品質管理セミナーベーシックコース講師の栗田 大渡(くりた ひろと)氏が聴講されました。
ご寄稿いただきました受講レポートを公開させていただきます。
※本セミナーは2024年度より『モノづくりにおける機械学習セミナー入門コース』へ名称が変わりました
多数のご参加を賜りました本セミナーに、
品質管理セミナーベーシックコース講師の栗田 大渡(くりた ひろと)氏が聴講されました。
ご寄稿いただきました受講レポートを公開させていただきます。
※本セミナーは2024年度より『モノづくりにおける機械学習セミナー入門コース』へ名称が変わりました
■ 私が抱いていた悩み
計測技術、データ解析技術の進歩により、IoT、AI、ビックデータなどの言葉が飛び交い、世の中は飛躍的なスピードで変化しています。その中で、モノづくりに携わる一員として何を学び、何を習得すべきなのか悩んでいる方は多いのではないでしょうか。
例えば、工場IoTの推進にて製造工程から数多く(数多くとはデータ数が多いこと、その一つのデータを構成する要素が多いこと)のデータが採取され、品質結果と紐づけされていたとします。今、それらのデータをどのように活用(解析)しているでしょうか。
データ全てを把握し、データ全てを使用して解析することはなかなかハードな作業であると同時に、従来のSQC手法では様々な制約により解析上困難な部分が出てくると思います。実際には、数多く採取したデータから一部のデータを抜き取り、従来のSQC手法で解析することが多いのではないでしょうか。また、解析方法、アウトプットを一式として社外へ外注したツールを使用しているのではないでしょうか。
この記事をお読みの皆様の中には、一部のデータで解析することに疑問を抱き、より良い解析方法を模索している方、中身がブラックボックスのツールから得られたアウトプットで意思決定することに躊躇する方がいるのではないでしょうか。
上述したように、何か上手いやり方はないか、どうやらビックデータ解析、データサイエンスなどというものがあるようだ。しかしながら、何から手を付ければ良いのか…、モノづくりに携わる一員として何を学ぶべきなのか…。私はそのような悩みを抱える一人でした。
■ セミナー概要と感想
当コースは、「モノづくりにおける」という枕詞にもあるように、モノづくりに携わる方の問題解決の「ツール」として、データサイエンス手法を学ぶことができます。勿論、すべての手法が学べるわけではありません。数ある手法の中からピックアップされたものについて学ぶことになります。しかしながら、それらの手法は「モノづくりにおける問題解決で活用できる手法」であり、実際の問題解決に大変有用な手法ばかりでした。
講義は、各手法に関して使用する目的や手法の数理、統計処理方法などの「理論」を座学にて学び、実際に統計解析ソフト(スタットワークス機械学習編)を使用した演習にて、それを「実践」することにより、実務への適用が大変イメージしやすい講義内容となっていました。
当セミナーは、IoT、AI、ビックデータ時代に則したデータ解析手法を、モノづくりにおける問題解決という背景にて学ぶことができ、モノづくりに携わる一員として何を学ぶべきか、何を習得すべきかという悩みを解決する糸口になる大変貴重なセミナーであると感じました。
■ 時間割と講義内容
時間割
本コースは、1日目がデータサイエンス概論とデータ前処理、2日目、3日目は具体的な手法と総合演習の計3日間のコースです。講義資料は、概念を図で表すなど、視覚的に表現するなどの工夫がされており、データサイエンス初心者でも理解し易いものでありました。
1日目は、データサイエンス概論ということで、従来のSQC手法と機械学習の違いについて、「なぜSQC手法ではビックデータに対応出来ないのか?」という切り口から機械学習の利点、必要性について学びます。同時に欠点(オーバーフィッティングなど)について、また、その欠点を補うための方法論(クロスバリデーションなど)について学びます。また、機械学習の数理である線形代数と確率について、データの前処理についてなど、機械学習を扱う上での最低限知っておくべきポイントについても学びます。
2日目からは具体的な手法として、次元削減を目的とした主成分分析、集団化(クラスタリング)を目的とした階層的クラスター分析、k-means法、混合ガウス分布などを学びます。クラスタリングは、データから層別要素という有益な情報を抽出するのに活用されます。従来、層別要素は4M(Man/Machine/Method/Material)などの切り口で固有技術、管理技術の面から抽出していましたが、クラスタリング手法を活用することで、データからその要素を見つけることができ、今まで見えていなかった情報の取得や、その集団化された情報から新たな攻め口を検討することも可能となります。
続いて、予測を目的とした手法では、回帰分析における多重共線性や汎化性の問題などを解決するため、「正則化」を学びます。従来、多重共線性の問題から変数間で相関のあるものはどちらか一方の変数しか解析に使用しない、データ数が少ない場合は汎化性が低くデータを追加して再度解析すると回帰係数が大きく変わるなどの問題がありましたが、正則化をすることで、より上手い変数選択、より精度の高い予測ができるようになります。
3日目は、分類を目的としてSVMや決定木、ランダムフォレストなどを学びます。総合演習ではそれらの手法(および2日目までに学んだ手法)を使い、グループに分かれ演習を行います。演習時間は約2時間で、演習内容は、射出成型工程における良品/不良品の分類になります。問題の背景から目標設定、解析手法の選定とデータ解析、結果についてのまとめと考察など、まさに自分がその工程の担当者になったように進めることができ、実務イメージが湧きやすい演習であります。最後に因果分析を目的としたglassoや異常検知、時系列解析などの機械学習手法の紹介もあります。
■ 最後に
冒頭でも述べたように、IoT、AI、ビックデータなどの漠然としたキーワードのもと、モノづくりに携わる一員として、何を学び、何を習得すべきなのか悩んでいる方は多いと思います。当コースを受講することで、その糸口を掴み、更に学ぶことで、抱えている問題の解決に繋がるのではないでしょうか。是非とも当コース、更には設計コース、ベーシックコースとデータサイエンス講座を受講してみることをお勧めします。
■本セミナーの概要を動画でご紹介!
実際のセミナーの様子も少し掲載しています。
約2分の短い動画ですので、是非ご確認ください!
- ※セミナー名称が変わりました※モノづくりにおける機械学習セミナー入門コース
- ※セミナー名称が変わりました※モノづくりにおける機械学習セミナーベーシックコース
- ビッグデータ時代のデータリテラシー1日コース
栗田 大渡(くりた ひろと)氏
株式会社アーレスティ 技術部 技術開発2課 工法開発グループ
一般財団法人 日本科学技術連盟 品質管理セミナーベーシックコース
班別研究会指導講師、宿題分科会委員
〈お問い合わせ先〉一般財団法人 日本科学技術連盟 品質経営研修センター 研修運営グループ
〒166-0003 東京都杉並区高円寺南1-2-1 / TEL:03-5378-1213
Copyright © 2021 Union of Japanese Scientists and Engineers. All rights Reserved.