Mail News Archives
 検索
   
SQC(統計とビッグデータ)
SQC

回帰分析の試用と使用<2017年10月27日>

1、回帰分析はよく利用される手法だが注意が必要である。
回帰分析は統計的手法の中で最もよく用いられるものの一つである。これは主に以下の目的で用いられる。
*予測(知りたい値の把握)、*制御(望む値の実現)
予測を目的に使用する場合には悩むことなく積極的に回帰を用いることができる。しかし、制御を目的に使用する場合には十分な注意が必要である。結論を先に言えば、制御に用いる場合は実験計画で取ったデータに基づいて作成した回帰式を用いるのが安全である。
回帰分析において使用するデータは2種類に分類できる。一つは調査データ(管理せずにとったデータ)で、もう一つは実験データ(管理して取ったデータ)である。調査データの処理の場合はデータの層別、調査の前提条件、調査時期、変数間の相関などに十分気を付けなければならない。そうしないと、誤った結果を得る危険や結果の解釈を誤る危険がある。これらの詳細については紙数の関係で紹介できないため関連する書籍を参考にされたい。
一方、実験データは管理して取ったデータなので安心して回帰分析を用いることができる。管理してデータを取るということはコストと時間がかかるが、回帰分析を通して確実な情報を獲得することができ、その上、回帰式を用いて予測はもちろんのこと制御ができるために大きなメリットがある。しかしながら、次に述べる注意点を忘れてはならない。

2、回帰式は取り上げた区間の中での近似式でしかない。
管理して取ったデータに基づいて回帰式(数式)が得られると、それは客観的な真の因果関係(本質的な式)を示していると誤解する人が少なくない。それは間違いで、回帰式は取り上げた区間の中での近似式でしかないのである。したがって、区間が変われば式は全く別のものになる。また、区間の外に対しても式を適用すること(外挿と呼ぶ)は危険である。あくまでも区間の中で式を適用すること(内挿と呼ぶ)が原則で、しかもそれは近似式であることを忘れてはならない。
さらに、内挿でも時にはうまく行かないことがあることに注意が必要である。何故ならば、回帰式は実験点(意図的に実施した条件)での値や観測点(たまたま遭遇した条件)での値だけをうまく説明するための便宜的な式なので、実験点と実験点の間や観測点と観測点の間の値に関しては何も保証してくれない。例えば、2次の関数に対して2水準の実験データからは1次式(直線)しか近似できない。取ったデータの2点(実測点)はうまく説明できるが、2次の関数をとらえることはできない。ただし、水準間があまり広くなければ実験点間は概ね線形であることが多いので心配はない。もし不安であるならば3水準ないし4水準の実験をすることが望ましい。そうすれば非線形性が吟味でき、必要ならば2次式で近似することもできるからである。
 もう一つの注意は積項(交互作用)である。多数の因子を取り上げて因子の水準幅を広くとった場合には、幾つかの因子の間には積項(交互作用)が存在する可能性がある。これを無視して単純な1次式を用いると、不適合な近似式となるために解析も設計も失敗してしまう。積項(交互作用)がありそうな場合には、それを扱うことができる実験計画のもとでデータを取る必要がある。良いデータを得るには手間とコストが不可欠なのである。

3、回帰式の適用限界と更新に注意しなければならない。
 あるとき某工場で作成した回帰式がとても有効であったとする。その事実は確かでも、それが同じ会社の他の工場や他社でも適用できるとは限らない。むしろ、ある条件(前提条件)の下での近似式なので、他の工場や他社では前提条件の相違からそのままでは使えない場合が多い。つまり回帰の利用は適用限界(式が得られた背景)に注意が必要なのである。
 当該の工場においてはしばらくの間は有効に機能するであろう。しかし、それがいつまでも有効とは限らない。時間が経過すれば工場自体の条件の変化(改善、改築、設備更新ほか)や工場を取り巻く条件(環境、原材料・部品、納入業者の状況ほか)が変化して機能しなくなる。したがって、回帰式の更新が必要になる。適切なタイミングで更新の必要性の有無を確認し、必要となった場合には更新しなければならない。

4、先ずは易しい実例に試用してその後に実際問題に使用する。
 以上いくつかの注意すべき点を述べたが、これらに注意を払いさえすれば回帰分析は極めて有用なツールである。しかし、使ってみないことにはその良さが分からない。まずは易しい実例に対して使ってみる(試用する)と良い。
予測の身近な実例として「マンションの賃貸料の予測」がある。マンションの諸条件(広さ、建築後の経過年数、最寄駅までの距離ほか)が分かれば賃貸料をかなりの精度で予測することができる。ただし、AエリアとBエリアでは異なるし、同じエリアでも時代が変わると異なる。したがって回帰式の適用限界と更新は不可欠なのである。複数のエリアでの予測や同一エリアに関して数年の間隔を置いた予測を比較するとこのことが実に良く分かる。
 制御の身近な実例は難しい。自分で制御してデータを発生させなければならないからである。そこで、簡単な実験として「紙ヘリコプターの滞空時間の制御」を紹介する。図1①に示すように紙を切り、上の部分の真ん中を切ったうえで互い違いの方向に折れば図1②の様にローマ字の大文字のT字形になる。下の部分にクリップを付けて空中に離すと飛行(正確には回転降下)する。この飛行時間を翼長さで制御することができる。数段階の翼長の紙ヘリコプターを作って飛ばせば図2の様に回帰式が得られる。その式を用いれば望む時間を飛行する機体の翼さの長さが分かるので、それを実際に作って飛ばして確認すると良い。何機も作成してそれらがほぼ望む時間で飛行したときは軽い感動を体験することができる。
 以上のような身近な例はいずれも手軽にできるので、是非一度試されたい。そして、身近な例で回帰分析の有用さを経験したならば、実際の問題に適用すると良い。何事も始めなければ始まらない。

5、回帰分析のソフトは玉石混交である。
ほとんどの統計ソフトは回帰分析を用意しているが、そのレベルは玉石混交である。単に最小二乗法で推定式を求める程度のことしかやってくれないソフトは不便でありかつ回帰分析の誤用を招く危険がある。例えば、安易に外挿(データを取った範囲の外で用いるという危険を孕む推定)を受け付ける(警告もなしに計算して結果を示す)とか、ただの寄与率(得られた式の過大評価)だけしか表示せず、自由度調整済み寄与率(得られた式の厳しめの評価)や自由度調二重整済み寄与率(得られた式のかなり厳しい評価)を表示しないソフトは薦められない。便利にそして安全に回帰分析を活用するにはStatWorksなどのきちんとした統計ソフトを利用することが望ましい。

6、回帰分析を試用して使用されたい。
 知識獲得(分かること)と実力獲得(出来ること)は同じではない。まさに「習うより慣れよ」で、失敗を恐れずに実際に使ってみることが肝要である。先ずは身近な易しい実例で試用してどのようなものなのかを実感し、次に実際の事例に使用することをお薦めする。

関連セミナー
 
戻る
Profile

     高橋 武則 氏
   (たかはし たけのり)
慶應義塾大学客員教授
1980年 早稲田大学大学院理工学研究科博士課程修了(工学博士)、東京理科大学助教授、同教授、慶應義塾大学教授、目白大学教授を経て2017年から現職。
『Statistical Methods for Quality Improvement』(共著、AOTS)、『統計的推測の基礎』(文化出版局)、『統計モデルとQC的問題解決法』(日本規格協会)、『統計的方法と管理・改善』(品質月間委員会)、『模擬生産・模擬実験と統計的品質管理』(品質月間委員会)、『マネジマント・サイエンス』(共著、培風館)、『統計モデルによるロバストパラメータ設計』(共著、日科技連出版社)など品質経営や統計的方法に関する書籍を多数執筆。2016年までデミング賞委員会副委員長、現在SAS Discovery Summit Japan委員会委員 など。

関連記事
 
 
〈お問い合わせ先〉一般財団法人 日本科学技術連盟 品質経営研修センター 研修運営グループ
〒166-0003 東京都杉並区高円寺南1-2-1 / TEL:03-5378-1213
Copyright © 2015 Union of Japanese Scientists and Engineers. All rights Reserved.