この記事には広告が含まれます。
- 最近よく聞くデータサイエンスって何?
- データサイエンスと医学って関係あるの?
データサイエンスという言葉を最近よく聞くようになり、このような疑問を抱いている、医師や医学生も多いと思います。
2024年現在、僕は医学部6年生で、データサイエンスを学び始めて約3年になります。はじめは本当に役に立つのかとか、できるようになるのかとか、悩むことも多々ありましたが、今では勉強してみてよかったと心から言えます。
この記事では、そのような疑問に答えるとともに、医学生や医師がデータサイエンスを学ぶべきだと思う3つの理由を書こうと思います!
データサイエンスってなに?
そもそも、データサイエンスとは、言葉通りデータに関する学問分野です。
より具体的には、データから有益な知見を得るために、統計学、機械学習、プログラミングなどの理論を活用することで、データの分析や解析を行う学問分野のことです。
最近データサイエンスが注目されるようになった背景としては、ビッグデータの蓄積が外せません。
ビッグデータに明確な定義はありませんが、簡単に言うと、「日々の中で蓄積された大量で多様で高速に処理できるデータ」のことだと理解しています。
近年において、スマートフォンなどのデバイスやSNSなどの普及、インターネットの高速化、データベースやハードディスクの進化といった、データを蓄積する環境が整ったことにより、ビッグデータを利用できるようになりました。
これらのデータをうまく活用することで、ビジネスや学問分野での進化を狙おうというのがデータサイエンスのモチベーションです。
これは医療も例外ではありません。
むしろ、医療業界は非常に大量のデータが日々蓄積される領域です。なので、データサイエンスを利用した技術が大きなインパクトを生み出すことができます。
たとえば、大量に得られた画像データから診断支援AIを作ったり、ある疾患の患者データから発病予測をしたりなど沢山の事例があります。
データサイエンスを学ぶべき3つの理由
ここでは、医学生、あるいは医師がデータサイエンスを学ぶべき理由を3つ挙げようと思います。
- 医療との親和性が高いから
- 他の分野との接点となる学問だから
- 医学の勉強が楽しくなる
順に解説しようと思います!
1.医療との親和性が高いから
これは先ほどの章でも話しましたが、医療業界は非常に大量のデータが日々蓄積される領域なので必然的に親和性が高いです。
データサイエンスを利用した研究も日々増加しており、学生の内から学んでおけば役に立つこと間違いなしです!
例えば機械学習、特にディープラーニングを使った研究が最近は非常に多いです。機械学習を通じて、データから有益な情報を抽出したり、予測したりすることができます。
実際、僕自身もバイオインフォマティクス系の研究室で機械学習を使った研究をしています。
学部生時代はもちろん、医師になってからも研究に利用したり、すでに使われている技術の理解や活用に役立ったりするだろうと思ってます。
2.他の分野との接点となる学問だから
データサイエンスはほぼすべての領域で活用される学問、あるいは技術です。そして、あらゆる学問はデータを通じて他の分野ともつながっています。例えば、医療データは、工学、化学、薬学などの分野に有用なデータでもあります。
つまり、医療分野のデータを利用して新たな知見を生み出すことは、必然的に他分野にも生きる知見となりえると、僕は考えています。
それは、社会への影響力という観点から大事なことだと思います。研究活動などするなら、せっかくなら大きなインパクトを与えるような研究をしたいですよね。
逆を言えば、医工連携とかを考えたときに、データサイエンスの知識がなければ、できることが限られてしまうかもしれません。
将来の可能性は大きい方がいいですよね!
3.医学の勉強が楽しくなる
データサイエンスを学ぶと、医学の勉強が楽しくなります!
データサイエンスを学ぶということは、同時に統計学や機械学習などの知識も付いてきます。
僕自身、統計学的視点から教科書や論文のデータを考察できたり、実習する中で機械学習の応用できる場所を探したりすることができ、今までとは違った楽しみができました。
データサイエンスを学ぶことで医学の勉強が楽しくなり、そうやって医学の勉強が進むとデータサイエンスを生かす場が見えてくるという、相乗効果が起きてきます!
つまり、医学とデータサイエンスを学ぶことはお得ってことです!
何を勉強すればいいの?
データサイエンスといっても、具体的に何を勉強すればいいかイメージが湧きにくいを思います。
僕の場合は、3つの領域を意識して勉強しています。それぞれ重なる部分もあります。
- 統計学などの数学
- 機械学習
- プログラミング
1.統計学などの数学
データを分析する上で統計学の素養は欠かせません。データを正しく解釈し、どのように考察するかという点で、統計学は非常に重要です。
他にも、線形代数や微分積分といった数学的知識も必要です。
統計学については、統計検定取得を目標に学習するのがおすすめです!
目標があると頑張れますし、より体系的に学ぶことができます。
僕自身、統計検定1級まで取得することで、統計学を基礎からしっかりと学ぶことができました。
統計検定については、以下の記事をご覧ください!
2.機械学習
機械学習は人工知能の一種で、コンピュータにデータを学習させることでデータのパターンやルールを抽出し、未知のデータに予測や判断をできるようにする手法のことです。
最近話題になっているディープラーニングも、この機械学習の手法の一つです。
機械学習はデータサイエンスをする上では欠かせない技術の一つです。最近は、機械学習手法を利用した医学分野の研究も増加傾向です。
そんな機械学習ですが、その理解には数学が必須ですし、実装にはプログラミングが必須です。
なので、他の2つがあっての機械学習だと思います。
3.プログラミング
データを分析、可視化する際や、上述の機械学習を実装する際など、プログラミングは必須の技術です。
言語としてはPythonがおすすめです。データサイエンスをやろうとしたら、RかPythonになると思いますが、Pythonの方が使っている人口が多いこともあり、情報が多いので勉強しやすいとお思います。
全くの初心者という場合には、以下の本を読めばプログラミングがどういう感じのものか掴めると思います。
もちろん、これら3つ以外にも様々な力が必要だとは思いますが、これら3つは少なくとも必須な力だと思います。
勉強法
上述したように、広範な知識が必要とされるので、単純にこれをやればいいというものはありません。
ただ、上記の3つは確実に必要な力なので、それらを身につけるための勉強法を共有しようと思います。
1.統計学
まず統計学ですが、これは統計検定を取得を目指すのが近道だと思います。
データサイエンスを本格的に勉強しようと思うなら、準1級までは勉強した方がいいと思います。準1級では広範なデータ分析手法が問われるので、データサイエンスという観点で非常に勉強になります。
ただ、統計学初学者の場合は、2級から順番に取得していくのがいいと思います。
統計検定2級の勉強法は以下の記事に書いているので、是非参考にしてみてください!
2.機械学習
僕の場合は、書籍で体系的に学びながら、実際に手を動かしてコードを書くことで勉強していました。
しかし、現在は、動画講座が非常に充実しています!
おすすめは、動画講座と書籍のハイブリッドです!
動画講座に関しては、僕も後になって受講してみたのですが、はじめからこれで勉強すればよかったという講座がいっぱいありました。
色んな記事で紹介していますが、おすすめは、Udemyとキカガクです!
Udemy
まずは、Udemyです!知っている方も多いとは思いますが、動画講座の鉄板です!
セール中であれば、1000~2000円で講座を買えるので、お財布にもやさしいです!
個人的には、「かめれおん」さんの講座が激おすすめです!この方の講座はセール対象にはならないですが、講座の完成度がレベチです。
講座を全部受講すれば、冗談抜きで、AIエンジニアやデータサイエンティストとして働けるレベルになれると思います!
Udemyのおすすめ講座については以下の記事にまとめたので、興味があれば是非見てみてください!
実際にこれらの講座を受講してKaggleで銀メダルを獲得することができたので、以下の記事にまとめてみました。
気になる方は是非見てみてください!
キカガク
もう一つのおすすめはキカガクの講座です!
1500以上のコンテンツ、130以上の講座があり、長期コースを受講するとこれらが永久的に受け放題です。コスパが圧倒的すぎます。
しかも、長期コースを受講すると、dodaの転職支援まで受けられます。
今なら、オンライン無料説明会に参加すると、16,500 円相当の有料講座をプレゼントしてくれます!興味のある方は、一度、無料オンライン説明会を受けてみるといいかなと思います!
書籍も大事
ただ、勘違いしてほしくないのが、書籍での勉強もめちゃくちゃ大事です!
動画では聞き流してしまうところも、じっくり腰を据えて勉強できるので、自身の理解があやふやなところがよくわかりますし、数式を追っていく訓練にもなります。
なので、繰り返しになりますが、
おすすめは、動画講座と書籍のハイブリッドです!
機械学習のおすすめ本こちらの記事で紹介してますので、是非ご覧ください!
3.プログラミング
プログラミングに関しては、機械学習の勉強をしていくと自然と身についていくと思います。
機械学習の実装を通して学んでいくのが、効率的かつ効果的です!
書籍やプログラミングスクールなど、色々な選択肢があると思います。
プログラミングに関しては下の記事で解説してますので、是非ご覧ください!
さいごに
僕自身まだまだスキルは足りていませんが、こうやって体験談を書くことで、データサイエンスを学ぼうとしている医師や医学生の後押しができたら幸いです。
これから必ず生きてくるスキルだと思うので、一緒に頑張っていきましょう!
コメント