hirohirohirohirosのブログ

地方国立大学に通う情報系学部4年

GCI2021Winterに参加しました.

 東京大学松尾研究室が運営している,グローバル消費インテリジェンス寄附講座GCI2021Winterを参加し,修了しました.

f:id:hirohirohirohiros:20220327231105j:plain

GCIとは

 https://gci.t.u-tokyo.ac.jp/gci-2021-winter/

 pythonやnumpyなどの基本的なプログラミングの知識から,教師あり学習や教師無し学習といった機械学習やデータサイエンスの知識,さらには,SQLやMLOpsなど,実際に機会学習を実装するに当たって必要なエンジニアリングの知識を一通り学べる講座となっています.

 特徴的なのは,マーケティングやゲスト講師の話など,データサイエンスとビジネスを絡めた視点での解説が多いことです.

事前知識

 基本的なPythonの知識はあった方が良いと思います.上のURLから講義を見れば分かる通り,第2回からNumpyの内容が始まりPythonの知識は持っている前提として話が進められます.

 ただ,そこまで高度な知識が求められるわけではなく,if文,for文,関数辺りを押えていれば問題無く進められると思います.

講義

 毎週2時間程度の講義があります.講義中はスプレッドシートが共有され,そこにリアルタイムで質問をすることが出来るシステムになっています(非常に便利).講義終わりにアンケートを提出し,簡単な課題を課されるのでそれに答えることで出席となります.修了要件に出席回数が何回以上という項目があったはずです.

 私はnumpyやmatplotlibについて既にある程度があったので序盤の講義はかなり簡単に進めることが出来ました.ただ,クラウド基礎やMLOps基礎は,初めて取り組む内容で,結構難しかったです.

コンペ

 GCI2021Winterでは2回のコンペが開催されました.1回目はkaggleでも有名なタイタニック,二回目は不動産の価格予測(だったかな?)コンペでした.kaggleやSIGNATEのような一日何回までsubmitが可能というようなシステムではなく,毎日○時と△時と□時に提出されたファイルの採点を行うといったシステムでした.

 複数実験して,複数提出ファイルを作っても,すぐ全て提出できるわけではなく,時間まで待つ必要があったので提出の管理をするのが大変だった記憶があります.

 このときはAI Questなどの他のイベントと重なり,あまりこのコンペに注力出来なかったです……(1回目約30位,2回目約60位)

 修了自体は1回でも提出すれば要件を満たします.

最終課題

 GCI最大の目玉の最終課題です.これはコンペとは異なり,予測精度を競う物ではありません.

 渡されるのはデータだけです.各カラムの説明も渡されましたが,英語で書かれており,何を意味しているのかさっぱり分からないカラムも結構ありました.

 最終課題はこのデータを分析し,相手に対して新たなビジネス提案をするという内容です.

 GCI2021Winterでは通信事業会社の顧客データでした(年によって内容が違うようです).通信事業会社の意思決定者に対して,このデータを使い,新たなビジネス提案をするスライドを15ページ以内でまとめて提出する必要があります.

 コンペとは異なり,目的変数が定められてる訳でも無く,勿論評価指標が決められてるわけでもありません.自分で,この通信事業会社のデータを分析し,新たなビジネスポイントを見つける必要があります.(ただ,データの中に解約したかどうかを示すchurnというカラムがあり,私を含めほとんどの人がこれを目的変数として分析していたと思います.)

 コンペではないのでただ性能が良いだけではいけません(私は正解率63%で最終課題を提出しました).どれだけ性能が良くても,それが相手に取ってメリットになるような提案が出来なければ意味ありませんし,あまり性能が良くなくても,相手にメリットがあると説明できれば(売り上げが向上するなど),良いビジネス提案となります.

 普段のコンペとはだいぶ勝手が異なり,どうしたらよいものか迷いましたが,相手に取ってメリットがあるということを数字を使いしっかり説明すること,その根拠や理屈をデータを分析してしっかり示すことを意識しました.

 修了要件として最終課題の提出もあります.あまりにひどい内容(白紙とか)じゃなければ基本落とす事はないというようなことを仰っていた気がするので,大変かもしれませんが取りあえず提出することが大切だと感じました.

 以下は私が作成した最終課題スライドの一部です.

f:id:hirohirohirohiros:20220327235015p:plain

f:id:hirohirohirohiros:20220327235043p:plain

f:id:hirohirohirohiros:20220327235318p:plain

オフィスアワー

 現役の学生から構成されるTA(ティーチングアシスタント)から,直接質問をすることが出来ます.これをオフィスアワーと言い,週に1~2回ほど1時間をめどに開催されていました.Python機械学習の事,GCIの事,学生生活の事など何でも聞くことが出来ました.私もオフィスアワーに何度か参加し,最終課題についてもアドバイスを沢山頂きました.

 GCIのサイトを見て頂ければ,TAが誰か分かります.このTAはどのような学生が担当しているのかというと,今までのGCIでの優秀生です.

優秀生

 コンペ,最終課題の結果から,優秀な成績を残した受講者は優秀生に選ばれます.GCI2021Winterでは,修了した受講者が180程度だったのに対し,優秀生は9人でした.

 優秀生に選ばれると,次回以降のGCIにTAとして参加することができ,オフィスアワーを開いて受講者の質問に答えたり,講義のサポートをしたり,課題の採点をしたりといった業務に参加することが出来ます.

 (これは私がオフィスアワーで直接聞いたことですが)優秀生の選抜は最終課題の内容を特に重視しているとのことでした.なので優秀生になりたい人は最終課題に力を入れると良いと思います.

 そして,私はこのGCI2021Winterの優秀生に選ばれました!最終課題はかなり時間を掛けたので,その成果が優秀生という形で表せたので良かったです.

 修了するだけでも凄く価値のある講座ですが,優秀生に選ばれるとTAだけでなく他にも様々良いことがあり(具体的な内容は実際に講義の中で説明されたりオフィスアワーで過去の優秀生から聞くことが出来ます),とっても価値のある称号です.

まとめ

 GCI2021Winterを修了することで,データサイエンスや機械学習について深い知識を得る事ができ,それをビジネスと絡めた視点で議論するという経験を得られることが出来ました.優秀生にも選ばれ,次回からは優秀生として,様々な形で貢献したいと思います.

次回GCI

 次回のGCIはGCI2022Summerです.

https://gci.t.u-tokyo.ac.jp/gci-2022-summer/

 4/19に初回の講義があり,8月辺りが最終課題の提出〆切になりそうです.この講義でいろいろな経験が出来るので是非参加してみて下さい!(私もTAとして参加します!)

 また,GCIは毎年夏と冬に開講しているので,この2022Summerが都合が合わなくても他の回のGCIに参加することをおすすめします.