Mail News Archives
 検索
   
SQC(統計とビッグデータ)
SQC

ポスト・データサイエンス時代<2017年02月15日>

1 ビッグデータは消えた?
データサイエンスに最も関連の深い言葉はビッグデータでしょう。しかし最近,数年前と比べて劇的に見かけなくなりました。その代わりに出てきたのが人工知能やIoT,Industry4.0です。ビッグデータはこれらにとって変わられたのでしょうか。

ビッグデータとは3Vとも言われる,大量(Volume),多種(Variety),高頻度・即時性(Velocity)の要素を持つ,文字通りの“ビッグ”データを起点にしたビジネス展開・企業活動です。そのために必要なのが“ビッグ”データから特徴や傾向,予兆,ヒントや問題点などを分析によって引き出す「データサイエンス」,そしてそれを実行でき,展開へつなげられる人である「データサイエンティスト」です。

ビッグデータの世界は,IBM社のWatsonやGoogleDeepMind社のAlphaGoの登場により飛躍的に変わりました。Watsonは大量のデータから知識を得てクイズ王になり,AlphaGoは深層学習を組み入れることにより囲碁でプロ棋士に勝ちました。また,Watsonは病気の診断でも,日々発表されている多くの論文を読み込み学習し好成績をあげた事例があります。このように現在ビッグデータは高度なデータ分析方法と合体し,人工知能の高度化を実現しています[1][2]。

したがって,ビッグデータは人工知能の一部になりました。また,このようなブレークスルーによって,人工知能のビジネスへの展開も多く見られるようになりました。今後,日本においてもWatsonは銀行のコールセンター業務の支援などに活用されるようです[3]。

ここで紹介した例は,ビッグデータを自動的に分析してサービスを行う製品組込型,製品のスマート化と言えるものです。この場合,データサイエンスは製品機能を作り込む,新たな固有技術と言えそうです。品質管理や設計支援のような管理技術の分野においては,IoT(Internet of Things)やIndustry 4.0が本格化すると,バリューチェーンの至る所でビッグデータを取ることができ,設計,生産など,また間接部門業務でも活用できる情報が得られるようになるでしょう。その時,やはり各業務を担当する技術者,スタッフはデータサイエンスが必要となってくると思われます。

『IoTとは何か』[4]によれば,IoTはすでに啓蒙活動期に入っており,“これからが普及の本番”のようです。これは世界的な動きですので,今後,ビジネスにおけるデータサイエンスの重要性はますます増えるでしょう。現在は,データサイエンスの手法を用いるために統計学や機械学習,プログラミングなどの知識やスキルがそれなりに必要ですが,すでにクラウド上でビッグデータ分析のサービスが提供されており,これからはスマートフォンのように,より使いやすいものに進化し,基本的な知識によってデータサイエンスができるようになると思います。再び,データサイエンスは統計的品質管理(SQC)のように,技術者が持つべき共通した管理技術となり,その時には,すべての人の管理技術となるように感じます。
 
2 データサイエンス活用の場は?
ビッグデータ,データサイエンスの利活用方法に注目すると,① 自動運転や商品推薦,天気予報などのように,製品・サービスが利用者に対して何かを行うという固有技術的な用い方のほうが,② 分析して得られた知識を業務改善などに役立てるという管理技術的な用い方よりも,圧倒的に多く見られます。また,利活用による効果をバリューチェーンに布置してみると,①は使用場面であり,②においても顧客離反分析などのようにマーケティング領域で多く見られます。

これは,ビッグデータ,データサイエンスの利活用方法が顧客や,顧客と企業との境界部分で多く生じていることを意味していると解釈できます。

では,企業の内部,すなわち,設計や生産などにおいては,ビッグデータ,データサイエンスの利活用方法がほとんどない,もしくは,できないのでしょうか。

特に,ものづくりに関わる技術者の立場として,注目すべき点でしょう。データサイエンスをSQCまで含むように定義すると答えはNoですが,そうでなくても,一般的なSQCの枠を超えて,ビッグデータとまではいかなくても,それに近いデータの積極的活用が行われてきたものがあります。
 
3 半導体製造における統計的プロセス管理
日本品質管理学会誌「品質」Vol. 44,No. 3に「ビッグデータ時代の品質管理」をテーマにした特集記事が掲載されました。その記事の一つに,半導体製造での統計的プロセス管理があります[6]。

半導体ウエーハの膜厚は重要特性であり,ウエーハ上の個々の膜厚より,うねりのような変動パターンを管理することが重要です。つまり,個々の値を特性にするのではなく,変動パターンを特性にし,変動パターンの変化を検出しなければならないということです。

これを実現するためには管理図の単独使用ではなく,多変量解析との融合が必要であり,方法論としてT2-Q管理図が挙げられています。また,ウエーハ上で膜厚の異常箇所を視覚化するためのウエーハマップを作成する際には,スプライン関数などによる平滑化手法が用いられます。これはLassoに通じる罰則付き最小二乗法で求めます。

半導体の特性によっては,測定にコストや時間がかかるものもあり,半導体製造においては多くの制御が働いているため品質特性の測定値を素早くフィードバックする必要があります。そのために,ソフトセンサーと呼ばれる技術があります。実際に品質特性を測定するのではなく,例えばプロセス変数から品質特性を推定(予測)するものです。ソフトセンサーの構築に,重回帰分析をはじめとして,データの様相に応じて,リッジ回帰,部分最小二乗法(Partial Least Squares :PLS)などが用いられており,サポートベクター回帰も注目されているようです。

これらはプロセス・ケモメトリクスと呼ばれ,化学の分野で発展してきました[7]。また,「品質」Vol. 44,No. 4の特集「ものづくりにおける解析手法の最前線」[8]においても,共分散構造分析(構造方程式モデリング)を用いたアルミニウム合金の鋳造における品質安定化や,外観検査においてカメラ画像からサポートベクターマシン(SVM)で良・不良の判定を行う技術,物理モデルと統計モデルを融合したソフトセンサーの開発などが紹介されています。
 
4 これからのデータ解析
SQC以上BigData未満のデータ解析技術の開発と適用は,各分野で,センサー技術や情報インフラの発達とともに,着実に発展しています。それは,実験計画法が農事試験で,管理図が生産において,因子分析が心理学で生まれたように,統計学そのものの性質に他ならないと思います。最近になって,情報処理の現場からデータ・マイニングと呼ばれるデータ解析法が生まれ,それが従来の統計学と相まって,ビッグデータ,データサイエンスと呼ばれるようになったのではないかと思います。ビッグデータは突然現れたものでなく,連続性のあるものだと感じます。
現在は,分析の自動化とも捉えられる人工知能と融合しています。また,SVMやLassoなどの登場により最適化理論との境界も曖昧となり,そちらからのデータ解析法の開発も進むことでしょう。ものづくりにおいてもデータサイエンスは着実に増しており,当たり前となる日も近いことでしょう。
 
[参考文献]
[1] 人口知能ビジネス,日経ビッグデータ,日経BP社,2015
[2] The Next Technology -脳に迫る人工知能 最前線-,日経コンピュータ,日経BP社,2015
[3] 日本IBMホームページ,https://www.ibm.com/smarterplanet/jp/ja/ibmwatson/
[4] IoTとは何か -技術革新から社会革新へ-,坂村健,KADOKAWA,2016
[5] 決定版 インダストリー4.0 -第4次産業革命の全貌-,尾木蔵人,東洋経済新報社,2015
[6] 川村大伸,“半導体製造におけるプロセス管理”,品質,Vol. 44, No. 3, pp. 12-15,2014
[7] 加納学,“プロセス・ケモメトリクス -統計的プロセス管理とソフトセンサーへの応用-”,日本化学会情報化学部会誌24   (2), pp.26-30,2006
[8] 入倉則夫(編),“ものづくりにおける解析手法の最前線”,品質,Vol. 44,No. 4, pp.4-25,20141
 

関連セミナー
 
戻る
Profile

       安井 清一
     (やすい せいいち)
2006年東京理科大学理工学研究科
経営工学専攻博士後期課程修了
博士(工学)取得後、
東京理科大学理工学部経営工学科
助手を経て、現在、助教。
主な専門分野は、統計的品質管理。

関連記事
 
〈お問い合わせ先〉一般財団法人 日本科学技術連盟 品質経営研修センター 研修運営グループ
〒166-0003 東京都杉並区高円寺南1-2-1 / TEL:03-5378-1213
Copyright © 2015 Union of Japanese Scientists and Engineers. All rights Reserved.