本記事を書いている筆者は、大学4年の研究室に配属されるタイミングで機械学習の勉強をはじめ、データサイエンスの領域に踏み込むようになりました。
とはいえデータサイエンス系の研究室ではなかったため、誰かに相談できる環境もなく、独学でスキルを身につけてきました/(^o^)\
当時は色々な記事を漁って、おすすめされている本や教材に手をつけていたのですが、2年経った今を思えば「初期段階で必要なかったな…」と思うことが多くあります。
もちろん後々になって勉強したことは返ってきて良いのですが、独学だと最初から小難しいことに取り組んで挫折するリスクの方が大きいです。
そこで本記事では、過去の自分のような大学生に向けてデータサイエンスを独学する手順について、たったの2ステップで紹介していきます。データサイエンスに興味を持った大学生は参考にしていただければと思います!
- 国立理系修士2年(24歳 | 専攻は機械学習)
- SEOマーケティング会社で実務を2年ほど経験
- ブログ運営3年目(月間10,000PVほど)
- 2025年4月からIT事業会社のデータサイエンティストとして働く予定で、現在はBigQueryを活用したGA4やGSCのデータ分析に注力
「3ヶ月でデータサイエンティストになれる!」みたいなことではなく、研究やインターンなどといった取り組みの初期段階において、「データサイエンスを活用していくための最低限の土台」を独学で身につけるための2ステップです。(世間では “簡単に〇〇になれる!” みたいな誇張表現が使われがちなので、一応注意書きとして先に述べておきます。)
大学生がデータサイエンスを独学する前に意識したいこと
まずは、大学生がデータサイエンスを独学するにあたって、意識したいことについてまとめていきます。(ここを飛ばすと痛い目に遭いやすいので、先に紹介しておきます。)
- ゴールを明確にする
- 早めに独学は卒業できるようにする
- 数学的な理解は後からで良い
- 困ったらデータサイエンティストに相談できる環境を作る
順番に解説していきます。
ゴールを明確にする
データサイエンスを独学するゴールが明確だと、モチベーションを維持しやすいです。
- データサイエンス系の長期インターンシップに参加する
- 機械学習や統計学に関する研究を行う
- 身の回りの課題をデータサイエンスの技術で解決する(バイトや業務委託などでデータ分析するなど)
- 有名企業のデータサイエンティストとして採用される
上記は大学生を想定した際のゴール例なのですが、ただでさえ独学だと挫折しやすいので、ゴールが明確だとちょっとしたことでは折れにくくなります。
加えて、効率的にスキル習得する道筋が見えてきやすいです。まずはゴールを明確にしていきましょう。
早めに独学は卒業できるようにする
データサイエンスは機械学習やら統計、SQL、BIなど色々な身につけるべきスキルがあるのですが、それらすべてを独学でマスターしようとすると多分挫折します(笑)
じゃあどうするかなのですが、先述の通り「早めにデータサイエンスを活用できる環境に身を置く」ことに限ります。
大学生におすすめはやっぱり “長期インターンに参加すること” でして、業務をこなしつつスキルアップできるのがすごく魅力的です。(先輩のデータサイエンティストに相談できる環境も作れますし。)
独学をずっと続けてもキャッシュが回らなくなるだけですし、目安は3ヶ月の独学 → インターンシップ応募みたいな流れが良いと思います。
数学的な理解は後からで良い
機械学習や統計モデルを実装するならPythonのフレームワークを使えば一瞬ですが、理論から理解しようとすると微分や行列計算などの数学的理解が必要になってきます。
理工学系を専門としている人なら基礎知識は身についてると思うのですが、そうでない人も一定数いるかと思います。
そういった人がいきなり機械学習の理論から学習しようとすると、絶対といって良いほど数学的な理解で苦しむはずです。
後々必要になった時に勉強すれば良いので、 “数学的な理解は後からでも良い” と考えておきましょう。
困ったらデータサイエンティストに相談できる環境を作る
やっぱり独学なので、困った時に誰も助けてくれません。
困り事を自分で解決しようとすると、何時間もかかってしまうなどザラにあります。また、ゴールに対して効率的にスキル習得しているつもりが、回り道してるなんてこともよくあります。
そういった際に、現役のデータサイエンティストに相談できる環境があると、余計な時間を過ごす可能性を限りなく低くすることができます。
問題はどこでデータサイエンティストを見つけるかですが、ココナラやMENTAというプラットフォームを活用してみましょう。メンタリング活動をしている現役のデータサイエンティストがいますので。
加えて、ChatGPTには課金するのがおすすめで、エラー解決やプログラムの理解に役立ちます。
大学生がデータサイエンスを独学する手順
ここからは、大学生がデータサイエンスを独学する手順について解説していきます。
- Pythonの基礎を習得する
- スタアカでデータサイエンスの基礎を習得する
なお、記事の冒頭でも述べましたが、「データサイエンスを活用していくための土台を作っていく」というのが前提です。
それを踏まえた上で解説していきます。
①:Pythonの基礎を習得する
Pythonを習得しておくと、データ処理であったり統計や機械学習モデルの構築まで完結します。
そのため、まずはPythonの基礎を習得していきましょう。
最近だとYouTubeで無料で学べるので、上記YouTubeチャンネルの好みを一つを選んで、1ヶ月ほど重点的に取り組んでみましょう。
とはいえ、この段階でPythonを完璧に理解しようとする必要はないです。後々になって慣れてきますので、「Pythonでこういったことができるんだなぁ〜」みたいな感覚で取り組んだらOKです。
②:スタアカでデータサイエンスの基礎を習得する
スタアカとは、月額1,280円でAI・データサイエンスが学べるプラットフォームのことです。
スタアカでは下記の内容を幅広く学習することができ、データサイエンスの基礎習得はこれでOKです。
- Pythonのデータ関連ライブラリ
- 統計学
- 機械学習
- ディープラーニング
- SQL
また、”BigQueryでデータ分析” や “生成AIの活用”、”Webアプリの作成” といった応用までコース内容としてあり、習得した基礎を活かすフェーズまで学習することができます。
データサイエンスの基礎を身につけるのに1ヶ月、データサイエンスの応用を学ぶのに1ヶ月くらいのスケジュールで進めていくのがおすすめで、あわせて2ヶ月で2,500円くらいです。
飲み会1回分くらいの値段でデータサイエンスを身につけることができるので、めちゃコスパ良いですね。
大学生がデータサイエンスを独学した後に取るべき行動
本記事の内容を実践すれば、3ヶ月ほどの独学でデータサイエンスの基礎は身に付くはずです。
その独学した後に取るべき行動についてもまとめて、本記事を終了したいと思います。
- 長期インターンに参加する
- Kaggleに取り組む
順番に解説していきます。
長期インターンに参加する
先述しましたが、データサイエンス系の長期インターンに参加することは超おすすめです。
インターンとして採用されたら、お金をもらいつつスキルアップできますからね。そこから就活するにしてもガクチカとして最強です。
- LabBase:理系学生におすすめで、データサイエンス系の求人が多い
- Wantedly:ITスタートアップでのインターンに興味があるならおすすめ
- Infraインターン:長期インターンに特化した求人サイト
上記は長期インターン先の企業を探せる無料サイトでして、いくつか登録しておくとOKです。
また、「データサイエンティスト 長期インターン」などで調べると募集している企業はいくらでもあるので、どこかしら採用してもらえるまで応募していきましょう。
Kaggleに取り組む
長期インターンに応募して、もし落ちまくったらKaggle(カグル)に取り組んでみましょう。
Kaggleでは、データ分析のコンペが定期的に開かれており、実績作りやスキルアップにもってこいのプラットフォームとなっています。
Kaggleの分析コンペに挑戦する → 実績やスキルを身につける → 長期インターンに再度応募する
長期インターンに落ちまくったら、上記の流れがおすすめです。もちろん、長期インターンに応募する前段階でKaggleに取り組んでおくのもOKです。
また、Kaggleに挑戦する上で読んでいない人はいないくらい下記の本は有名なので、分析のお供に購入しておきましょう。
まとめ:大学生がデータサイエンスを独学する手順は2ステップでOK
本記事では、大学生がデータサイエンスを独学する手順について、たったの2ステップでまとめました。
簡単に振り返ると以下2ステップです。
- Pythonの基礎を習得する
- スタアカでデータサイエンスの基礎を習得する
データサイエンスの基礎は上記だけで十分身につきます。
その後は長期インターンに参加するなり、Kaggleに取り組むなりで、あなた次第の行動をとっていきましょう(*`・ω・)ゞ
それでは本記事は以上とします。最後まで読んでいただきありがとうございました!