AIが作る筋トレメニューは安全か ― ChatGPTの”献立”をそのままやる前に確認したいこと【2024-2026】

AIが作る筋トレメニューは安全か ― ChatGPTの”献立”をそのままやる前に確認したいこと【2024-2026】 AI x FITNESS

イントロ

「筋トレのメニューを作って」——ChatGPT や Gemini のような生成 AI に頼めば、数秒でそれらしいトレーニングプログラムが返ってきます。無料で、24 時間、何度でも。実際に試した方も多いのではないでしょうか。では、そのAI が作った筋トレメニューを、そのまま実行しても安全なのでしょうか。

この記事では、生成 AI が作る運動プログラムの「品質」と「安全性」を実際に評価した 2023-2026 年の研究をもとに、AI メニューの「使える部分」と「危ない部分」を分けて整理し、最後に「安全に使うための具体的なチェック」までまとめます。煽らず、断定もせず、どこまでが現時点のエビデンスで言えるのかを区別するのが目的です。

📅 本記事は 2026 年 6 月時点の研究・ガイドライン情報に基づきます。生成 AI のモデル・性能は変動がとくに速い領域です。本記事で触れる評価結果も、検証時点のモデルに基づく点にご留意ください。

なお本記事は一般的な情報提供であり、医療上の助言ではありません。持病・痛み・服薬中の方や、運動を新しく始める方は、自己判断せず医療機関や専門家にご相談ください。なお、AI トレーナー全般の得意・不得意は「AIパーソナルトレーナーは2026年どこまで使えるか」で整理しています。本記事は、その中でもとくに「AI にメニューを丸ごと作らせる」使い方の安全性に絞って掘り下げます。

1. 結論を先に ― AI メニューは「下書き」には使えるが、そのまま実行する前に確認が必要

先に結論を述べます。複数の研究を通して見えてくるのは、生成 AI が作る筋トレメニューは「たたき台(下書き)」としてはそれなりに優秀だが、専門家のチェックを経ずに「最終版」としてそのまま従うには危うい、という評価です。

研究者たちの表現を借りれば、AI が作るプログラムは「さらに調整が必要なテンプレート」であり、「下書きを書く補助ツールにはなるが、人の専門知識を要する」ものとして位置づけられています。新しいモデルほど品質は上がっていますが、それでも安全に関わる弱点は完全には消えていない——これが現時点の素直なまとめです。理由を順に見ていきます。

2. 研究は何と言っているか ― AI メニューの「品質」評価

ここ数年、運動科学やスポーツ医学の専門家が、AI が生成したトレーニングプログラムを実際に採点する研究が相次いで発表されました。なお、これらの評価研究の多くは ChatGPT 系モデルを対象にしている点は、前提として知っておくとよいでしょう(生成 AI 全般の総括ではありません)。

2024 年に JMIR Medical Education に掲載された研究(Zaleski ら)は、ChatGPT の運動推奨を米国スポーツ医学会(ACSM)の基準と照合しました。結果は示唆的で、提示された内容の正確さ自体は 90.7%と高かった一方、運動処方として必要な要素を網羅できていたのは 41.2% にとどまりました。さらに、誤りの約 53% は「健康な人にまで医師の許可を求める」過剰な慎重さだった、と報告されています。「言っていることは概ね正しいが、抜け落ちが多い」という、AI メニューの典型的な弱点を示した一例です。

2025 年に BMC Sports Science, Medicine and Rehabilitation に載った研究(Genç ら)は、ChatGPT に 12 週間の筋力トレーニングプログラムを作らせ、7 名の専門家が 5 点満点で採点しました。モデルが新しくなるほどスコアは上がり(GPT-3.5=2.37 → GPT-4o=3.61 → GPT-4.1=4.14)、進歩は明確です。ただし、弱いモデルでは生理学的に無理のある処方(たとえば「最大筋力の 85% の重さで 15 回」——通常その強度では数回しか挙がりません)が見られ、最高評価だった最新モデルでも「実際の伸びを測らずに重量を増やす」進め方が残っていた、と指摘されています。

10 名のコーチが複数の AI(ChatGPT・Gemini など)のプログラムを 27 項目で評価した研究(Havers ら, 2025, Biology of Sport)でも、総合品質は「中程度」で、多くの項目が 4 点(5 点満点)に届きませんでした。強度や「限界までの余裕(追い込み度)」の指定が曖昧で、筋肥大と筋力という目的の違いが反映されていないプランも見られたといいます。AI 評価研究の先駆けとなった Washif ら(2024, Biology of Sport。オンライン公開は 2023 年)も、ChatGPT は「プログラムの下書きを書く補助にはなるが、人の専門知識が必要」と結論づけています。

まとめると、AI メニューの品質は新しいモデルで着実に向上しているものの、「専門家の手直し前提」という方向性は 2026 年時点でも変わっていない——この点は、現時点の少数研究(その多くは ChatGPT 系モデルが対象)でおおむね共通して指摘されています。

3. AI メニューが間違えやすい「設計」の 5 パターン

では、具体的にどこを間違えやすいのか。研究で繰り返し指摘される失敗パターンを 5 つに整理します。

  • ① 強度・回数・重量の不整合:目的(筋力か筋肥大か)に対して、重さと回数の組み合わせが噛み合わないことがあります。前述の「85%・15 回」のように、物理的に成立しにくい指定が混じる例が報告されています。
  • ② 進め方が「測らずに増やす」:本来は実際の伸びを見ながら少しずつ負荷を上げる(漸進性)のが原則ですが、AI は経過を測定しないまま機械的に重量を増やす進行を提案しがちです。
  • ③ 個別化が浅い:年齢・経験・性別・目的の違いが十分に反映されず、誰にでも当てはまる「一般論」に寄りがちです。安全のための「代替種目」が示されないことも指摘されています。
  • ④ 禁忌・既往症の見落とし:ここが安全上もっとも重要です。たとえば 2 型糖尿病の患者向けプランを ChatGPT に作らせた研究(Akrimi ら, 2025, Sports)では、増殖性網膜症のある人に高強度の運動を勧める(眼内出血・網膜剥離のリスクがあり禁忌)など、深刻な安全上の問題が見られました。高血圧の人に対して、血圧を急上昇させる「いきみ(バルサルバ)」を避ける注意が抜ける例も知られています。
  • ⑤ もっともらしい誤り(ハルシネーション):生成 AI は、事実でない内容を自然な文章で自信たっぷりに提示する弱点があります。メンタルヘルス分野の文献を AI(GPT-4o)に挙げさせた研究(Linardon ら, 2025, JMIR Mental Health)では、引用の約 20%(19.9%)が実在しない捏造で、なじみの薄いテーマほど捏造率が上がったと報告されています。これは特定の領域・条件での結果ですが、運動分野でも同種のリスクは想定され、「根拠として論文を挙げているから安心」とは限らないことを示しています。

共通するのは、誤りが「自然な文章」で提示されるため、利用者が気づきにくいという点です。とくに④の禁忌の見落としは、知識のない人ほど見抜けず、そのまま実行してしまうリスクがあります。

4. そもそも「安全なメニュー」とは ― 権威ガイドラインの最小要件

AI メニューを評価するには、比較対象となる「安全なメニューの基準」を知っておくと役立ちます。主要なガイドラインは、驚くほどシンプルな原則に収束しています。

  • 全身をバランスよく、週 2 回以上:世界保健機関(WHO, 2020)は、すべての成人に対し主要な筋群を使う筋力トレーニングを週 2 日以上行うことを推奨しています。日本の厚生労働省「健康づくりのための身体活動・運動ガイド 2023」も、成人・高齢者ともに筋トレを週 2〜3 日と示し、自重種目(腕立て・スクワット等)も含めています。
  • 少しずつ負荷を上げる(漸進性過負荷):厚労省ガイドも「漸進性過負荷の原則」を明記しています。いきなり重くするのではなく、徐々に、というのが安全と効果の両立点です。
  • 「もっと」は必ずしも良くない:2026 年の用量反応メタ分析(Pelland ら, Sports Medicine)は、量を増やすほど効果は伸びるものの「逓減(だんだん頭打ち)」になることを示しました。量や頻度を増やしすぎると、得られる上乗せは小さくなる一方で負担は増えます。また、毎回「限界まで追い込む」ことが筋肥大に必須でないことも、メタ分析(Refalo ら, 2022, Sports Medicine)で示されています。
  • 技術(フォーム)優先:筋トレのケガは肩・腰・膝・手首に集中し、主な原因は不適切なフォームと過剰な負荷とされています(Kawa ら, 2025)。逆に、比較研究では、従来型のレジスタンストレーニング(筋力トレ)は、さまざまなトレーニング様式の中でもケガの発生率が比較的低い部類とされています(Serafim ら, 2023)。フォームと負荷の管理ができれば、筋トレは過度に恐れる必要のない運動だと整理できます。

つまり「安全なメニュー」とは、全身を・週 2 回以上(目安は 2〜3 回)・正しいフォームで・少しずつ・やりすぎないという地味な原則の上に成り立ちます。AI メニューがこの原則から外れていないかを見る、というのが実用的なチェックの出発点になります。

5. AI メニューを“安全に”使う 5 つのチェック

AI を使うな、という話ではありません。「下書き」として賢く使うための、実践的なチェックを 5 つ挙げます。これらは前章の 5 つの失敗パターンに、おおむね一対一で対応する対策です。

  1. 始める前に自分の状態を確認する:心臓・血圧・代謝の持病や気になる症状がある方、運動習慣がなく強い運動を始める方は、まず医療機関に相談を。国際的に使われる事前チェック票「PAR-Q+」のようなセルフスクリーニングも目安になります(AI メニューはこの確認を省きがちです)。
  2. フォームは人の目で確認する:ケガの多くはフォームと過負荷が原因です。AI のテキストだけでは動作の質は判断できません。最初の習得期だけでも、対面の指導や経験者のチェックを併用すると安全です。
  3. 進め方は控えめに、痛みが出たら中止:AI が「毎週増やす」と書いていても、鵜呑みにしない。少しずつ・伸びを見ながらが原則です。痛み・しびれ・体調の異変があればその場で中止し、必要なら受診を。
  4. プロンプト(指示)を具体的にする:年齢・経験・目的・使える器具・既往症・頻度などを詳しく伝えると、AI の出力品質は上がります。実際、指示を詳しくすると評価点が上がる(14.8 → 16.8 点/20 点満点)一方で、同じ指示でも回答にばらつきが残り、過度に保守的になりやすいことも報告されています(Yang ら, 2025)。「具体的に頼む。でも鵜呑みにしない」が現実解です。
  5. 不安な要素は人に確認する:とくに禁忌・既往症・フォームは、AI の弱点と人の強みがちょうど裏返しの関係です。一部の研究では、監督下のトレーニングは自己流より筋力の伸びが大きく(Fisher ら, 2022)、別の無作為化試験では対面指導の継続率が自己流より高かった(88% 対 52%)と報告されています(Gavanda ら, 2025)。いずれも限られた条件での結果ですが、「迷ったら人に確認する」価値を示しています。

6. それでも「人に頼るべき」境界

AI メニューを下書きとして使うとしても、取り違えるとケガや健康被害につながる領域は、引き続き人の観察と専門知識が要になります。具体的には次のような場面です。

場面 向いている担い手 理由
メニューの下書き・記録・進捗管理 AI(得意) 低コストで素早い、たたき台に向く
フォーム・動作の安全確認 人(重要) 痛み・癖・個人差は文脈判断が必要
既往症・痛み・服薬中の対応 人/医療(必須) 安全の最終判断は専門領域
妊娠中・産後・高齢の運動 医療/専門家(必須) 個別性が高く、禁忌の確認が要る
初心者の最初のフォーム習得 人(強み) 初期の癖は後で直しにくい

とくに、持病のある方・妊娠中の方・心血管リスクのある方は、AI メニューをそのまま実行する前に必ず医療機関にご相談ください。これらは個別性が非常に高く、一般的なプログラムが当てはまらない(むしろ危険な)ことがあります。

FitSync も、AI を「人の指導を置き換えるもの」ではなく「人の指導を支える下書きツール」として捉える立場です。記録や習慣化は AI に任せ、フォーム・安全・その人に合わせた微調整は人が確認する——この組み合わせが、現時点では無理が少ないと考えています。初心者の方や、英語での指導をご希望の方には、六本木を拠点としたマンツーマン指導(出張対応あり)で、フォームと安全をていねいに確認しながら進めています。なお「限界まで追い込むべきか(追い込み度の最適点)」は別記事「筋トレは限界まで追い込むべきか ― failure と RIR の科学」でも扱っています。

まとめ

生成 AI が作る筋トレメニューは、下書きとしては十分に役立ちます。新しいモデルほど品質も上がっています。一方で、強度と回数の不整合・測らない進行・個別化の浅さ・禁忌の見落とし・もっともらしい誤りといった弱点が残り、専門家のチェックなしに「最終版」としてそのまま従うことには、現時点の少数研究(その多くは ChatGPT 系が対象)では、慎重な見方がおおむね共通しています。

「全身を・週 2 回以上・正しいフォームで・少しずつ・やりすぎない」という地味な原則に照らし、AI メニューを下書きとして使い、安全に関わる部分は人に確認する。それが、2026 年に AI と上手に付き合う現実的な方法だと言えそうです。

繰り返しになりますが、本記事は一般的な情報提供であり、個別の診断・治療・運動処方に代わるものではありません。持病・痛み・しびれ・服薬がある方や、妊娠中・運動を新しく始める方、運動中に体調の異変を感じた方は、自己判断せず医療機関や専門家にご相談ください。

FAQ

Q1. AI に作ってもらった筋トレメニューを、そのままやっても大丈夫ですか?
下書きとしては便利ですが、専門家のチェックを経ずにそのまま従うのは避けたほうが安全です。研究では、AI のプログラムは「内容は概ね正確でも要素の抜けが多い(網羅は約 4 割)」「最新モデルでも無理のある処方や禁忌の見落としが残る」と報告されています。たたき台として使い、強度・進め方・安全面は確認することをおすすめします。

Q2. 初心者が AI メニューだけで筋トレを始めても問題ありませんか?
最初のフォーム習得期は、人の目を併用するのが安心です。ケガの多くはフォームの不備と過負荷が原因で、初期についた癖は後で直しにくい傾向があります。AI のテキストだけでは動作の質は判断できないため、最初だけでも対面の指導や経験者の確認を取り入れると安全です。

Q3. 持病があったり妊娠中だったりする場合はどうすればいいですか?
これらは個別性が非常に高く、一般的な AI メニューが当てはまらない(むしろ危険な)ことがあります。研究でも、AI が禁忌(たとえば特定の合併症がある人への高強度運動)を見落とす例が報告されています。実行前に必ず主治医・専門医にご相談ください。

Q4. AI が出してくる「根拠の論文」は信用できますか?
鵜呑みは禁物です。生成 AI は実在しない文献を自然な体裁で提示することがあり、メンタルヘルス分野を題材にした研究では引用の約 2 割が捏造だったという報告もあります。運動分野でも同種のリスクは想定されるため、根拠が示されていても、可能なら一次情報(公的機関のガイドラインや原著論文)で裏取りすることをおすすめします。

Q5. AI メニューの品質を上げるコツはありますか?
年齢・経験・目的・使える器具・既往症・頻度などを具体的に伝えると、出力の質は上がりやすくなります。ただし、同じ指示でも回答にばらつきが出たり、過度に保守的になったりすることもあるため、「具体的に頼む。でも最終判断は鵜呑みにしない」のが現実的です。

参考文献

各ソースが「何の典拠か」を併記します。数値は研究条件により幅があります。

  1. Zaleski AL, Berkowsky R, Thomas Craig KJ, Pescatello LS.「Comprehensiveness, Accuracy, and Readability of Exercise Recommendations Provided by an AI-Based Chatbot: Mixed Methods Study」JMIR Medical Education (2024). doi:10.2196/51308 ― ChatGPT の運動推奨は正確さ 90.7% だが網羅性 41.2%、誤りの約 53% が健康な人への過剰な受診勧奨だったことの典拠
  2. Genç A, ら.「Comparative evaluation of ChatGPT versions in training program design: scientific approach, accuracy, and practical applicability」BMC Sports Science, Medicine and Rehabilitation (2025). doi:10.1186/s13102-025-01409-7 ― 新モデルほど品質向上(2.37→3.61→4.14/5)も、測定によらない進行などの課題が最新版でも残ることの典拠
  3. Havers T, ら.「A professional assessment of training plans for muscle hypertrophy and maximal strength developed by generative artificial intelligence」Biology of Sport 42(4) (2025). doi:10.5114/biolsport.2026.152350 ― 複数 AI のプログラムが「中程度」品質で、強度・追い込み度(%1RM・限界までの余裕)の指定が曖昧なことの典拠
  4. Washif JA, ら.「Artificial intelligence in sport: Exploring the potential of using ChatGPT in resistance training prescription」Biology of Sport 41(2) (2024). doi:10.5114/biolsport.2024.132987 ― AI は「下書きの補助にはなるが人の専門知識が必要」という基本的位置づけの典拠
  5. Akrimi S, ら.「ChatGPT-4o-Generated Exercise Plans for Patients with Type 2 Diabetes Mellitus—Assessment of Their Safety and Other Quality Criteria by Coaching Experts」Sports (MDPI, 2025). doi:10.3390/sports13040092 ― 増殖性網膜症など合併症のある患者への不適切な高強度推奨など、禁忌見落としの典拠
  6. Yang Z, ら.「More details, less variability? A crossover design study on the impact of information granularity on ChatGPT’s training program design」Biology of Sport (2025). doi:10.5114/biolsport.2026.154148 ― 詳細なプロンプトで品質が上がる(14.8→16.8/20)が、ばらつき・過度な保守性が残ることの典拠
  7. Linardon J, ら.「Influence of Topic Familiarity and Prompt Specificity on Citation Fabrication in Mental Health Literature Generated by GPT-4o」JMIR Mental Health (2025). doi:10.2196/80371 ― GPT-4o が引用の約 19.9% を捏造し、なじみの薄いテーマで捏造率が上がることの典拠
  8. Bull FC, ら(World Health Organization).「WHO 2020 guidelines on physical activity and sedentary behaviour」British Journal of Sports Medicine 54(24):1451-1462 (2020). doi:10.1136/bjsports-2020-102955 ― 主要筋群を使う筋力トレーニングを週 2 日以上、という公的推奨の典拠
  9. 厚生労働省「健康づくりのための身体活動・運動ガイド 2023」(2024 年 1 月). ― 成人・高齢者ともに筋トレ週 2〜3 日、漸進性過負荷の原則を示す国内ガイドラインの典拠
  10. Pelland JC, ら.「The Resistance Training Dose Response: Meta-Regressions Exploring the Effects of Weekly Volume and Frequency on Muscle Hypertrophy and Strength」Sports Medicine 56(2):481-505 (2026). ― 量を増やすほど効果は逓減し、やりすぎは負担に見合わないことの典拠
  11. Refalo MC, ら.「Influence of Resistance Training Proximity-to-Failure on Skeletal Muscle Hypertrophy: A Systematic Review with Meta-analysis」Sports Medicine 53(3):649-665 (2022). ― 毎回「限界まで追い込む」ことが筋肥大に必須ではないことの典拠
  12. Serafim TT, ら.「Which resistance training is safest to practice? A systematic review」Journal of Orthopaedic Surgery and Research 18:296 (2023). doi:10.1186/s13018-023-03781-x ― 伝統的な筋力トレが各トレーニング様式の中でケガの発生率が最も低い部類であることの典拠
  13. Kawa O, ら.「Most Common Injuries in Resistance Training: Mechanisms, Therapeutic Interventions, and Preventive Strategies」Cureus 17(10):e94035 (2025). doi:10.7759/cureus.94035 ― ケガが肩・腰・膝・手首に集中し、主因が不適切なフォームと過剰負荷であることの典拠
  14. Fisher JP, ら.「The role of supervision in resistance training」International Journal of Strength and Conditioning (2022). ― 監督下のレジスタンストレーニングが自己流より筋力の伸びが大きい(SMD≒0.40)ことの典拠
  15. Gavanda S, ら(無作為化対照試験).「Supervised versus app-based versus self-guided resistance training」Journal of Strength & Conditioning Research 39(11) (2025). doi:10.1519/JSC.0000000000005216 ― 対面指導の継続率が自己流より高かった(88% 対 52%)ことの典拠

※ 本記事は一般的傾向の整理であり、個別の指導・診断・治療に代わるものではありません。生成 AI の仕様・性能は短期間で変わるため、最新情報もあわせてご確認ください。

コメント

タイトルとURLをコピーしました