テスト作成・採点の革命!AIで実現する評価業務の効率化
- 自習ノート2
- 27 分前
- 読了時間: 14分
はじめに
「定期テストの問題作成に何時間もかかってしまった……」 「記述式問題の採点基準、これで本当に公平なのかな?」 「通知表の所見、30人分書くのにまた週末が潰れる……」
多くの先生方が、日々の評価業務に膨大な時間を費やしています。文部科学省の調査によれば、教員の時間外勤務の主な要因の一つが「成績処理・評価関連業務」であることが明らかになっています。
しかし今、生成AI(ChatGPTやGeminiなど)の登場によって、この状況が大きく変わろうとしています。
本記事では、単なる時短テクニックではなく、「評価の質(客観性と納得感)を高めるためのAI活用」という視点から、テスト作成・採点業務の効率化について具体的に解説します。実際に佐賀県武雄市の学校現場で導入され、成果を上げている事例も交えながら、明日からすぐに使える実践的な方法をお伝えします。
目次
1. なぜ今、評価業務のAI活用なのか
評価業務の2つの課題
教員の評価業務には、大きく分けて2つの課題があります。
課題①:時間がかかりすぎる テスト問題の作成、採点、所見の執筆など、評価に関わる作業は膨大です。特に記述式問題の採点や通知表の所見は、一人ひとりに向き合う必要があるため、どうしても時間がかかります。
課題②:評価の「ブレ」が生じやすい 同じ答案でも、採点する時間帯や教員の体調によって評価が変わってしまうことがあります。また、複数の教員で採点する場合、基準の統一が難しいという問題もあります。
AIが果たす2つの役割
生成AIは、これらの課題に対して2つの役割を果たします。
役割①:作業時間の削減 問題の作成支援や文章の下書き作成により、ゼロから考える時間を大幅に短縮できます。
役割②:評価の標準化と質の向上 採点基準の明確化やルーブリックの作成支援により、「何となく」の評価から脱却し、客観性と納得感のある評価を実現できます。
つまり、AIは単なる「時短ツール」ではなく、「評価の質を高めるパートナー」として活用できるのです。
2. 定期テスト・小テストの作成補助
ポイント:AIを「良き壁打ち相手」にする
テスト問題の作成において、AIの最大の強みは「アイデアの壁打ち相手」になってくれることです。ゼロから完璧な問題を作ってもらうのではなく、たたき台や複数の選択肢を提示してもらい、教員が最終的に調整するという使い方が効果的です。
具体的な活用方法
(1) 教科書本文から問題を生成
教科書の該当ページや単元の内容をコピーして、以下のようにAIに指示します。
プロンプト例:
以下の教科書本文を読んで、中学2年生レベルの
・選択問題(4択)を3問
・記述問題(50字程度)を1問
作成してください。
【教科書本文】
(ここに本文を貼り付け)
このように指示することで、数分で複数の問題案が得られます。
(2) 難易度調整による類題作成
既存の問題を入力し、難易度を調整した類題を作成することもできます。
プロンプト例:
以下の問題と似た傾向で、難易度を少し下げた類題を3問作成してください。
【既存の問題】
(ここに問題を貼り付け)
これにより、習熟度別の問題や、再テスト用の問題を効率的に準備できます。
(3) 語彙リストから小テスト作成
英語や国語の語彙テストも、AIを使えば簡単に作成できます。
プロンプト例:
以下の単語リストから、中学1年生向けの小テスト(10問、選択式)を作成してください。
各問題には、同じ品詞の紛らわしい選択肢を含めてください。
【単語リスト】
apple, book, cat, dog, enjoy...
注意すべきポイント
必ず内容を確認する:AIが生成した問題には、事実関係の誤りや不適切な表現が含まれることがあります。
学習指導要領との整合性をチェック:学年や単元の到達目標に合っているか確認しましょう。
著作権への配慮:教科書の文章をそのまま使用する場合は、テスト作成の範囲内で適切に利用してください。
3. 記述式問題の採点基準(キーワード)作成
ポイント:採点の「ブレ」をなくし、公平性を保つ
記述式問題の採点で最も難しいのは、「どこまでできていれば何点なのか」という基準を明確にすることです。AIを活用することで、この基準作りを効率化し、採点の一貫性を高めることができます。
具体的な活用方法
(1) 模範解答からキーワードを抽出
まず、教員が作成した模範解答をAIに入力し、評価すべきキーワードを抽出してもらいます。
プロンプト例:
以下の模範解答から、採点時に必ず含まれているべきキーワードを3つ抽出してください。
【問題】
江戸幕府が鎖国政策をとった理由を説明しなさい。
【模範解答】
キリスト教の広がりを防ぎ、幕府の権力を安定させるため。また、貿易を管理することで経済的な利益を独占する目的もあった。
AIの出力例:
キリスト教の制限
幕府権力の安定
貿易の管理・独占
(2) 部分点の基準を段階的に作成
次に、部分点を与える基準を段階的に作成します。
プロンプト例:
上記の模範解答について、部分点を与える基準を5段階(0点・2点・4点・6点・8点・10点)で作成してください。

活用のメリット
採点時間の短縮:明確な基準があることで、迷わず採点できます。
複数教員での採点の統一:同じ基準を共有することで、誰が採点しても同じ結果になります。
生徒への説明責任:「なぜこの点数なのか」を論理的に説明できます。
武雄市の実践から
佐賀県武雄市の中学校では、生成AIを使って通知表の評価記入例を作成し、市内で共有する取り組みが行われています。この事例では、各種通信の誤字・脱字チェックをAIで行うことにより、教務主任、教頭、校長のチェック時間が短縮されたという成果が報告されています。
この「ダブルチェック機能」は、テスト問題の作成や採点基準の作成にも応用できます。例えば、自分で作った採点基準をAIに入力し、「この基準に漏れや曖昧な点はないか」とチェックしてもらうことで、より精度の高い基準を作成できます。
4. ルーブリック評価表の作成支援
ポイント:評価の標準化で「何となく」から脱却
ルーブリック評価については、当ブログで過去に詳しく解説していますが、ここではテスト作成・採点との関連性を中心に、改めてその重要性をお伝えします。
▶ 詳しくはこちらの記事をご覧ください:
ルーブリックとは
ルーブリックとは、評価基準を具体的な行動や成果として段階的に示した表のことです。特に、パフォーマンス評価(発表、レポート、実技など)において、「何ができていれば良いのか」を明確にする際に有効です。
テスト評価への応用
従来、ルーブリックは主にパフォーマンス課題の評価に使われてきましたが、記述式テストの採点基準としても活用できます。
例えば、社会科の「説明問題」や理科の「考察問題」など、答えが一つではない問題において、ルーブリックを使うことで評価の一貫性が保たれます。
サンドイッチ法による作成
ルーブリック作成で最も時間がかかるのが、各マス目の「記述語(ディスクリプタ)」を書く作業です。ここで有効なのが「サンドイッチ法」です。
サンドイッチ法とは:
最高レベルを書く:「完璧な状態」を先に書く
最低レベルを書く:「最低限の状態」を次に書く
中間レベルを書く:最後に、両者の中間を埋める
この順序で作成すると、段階の差がはっきりし、書きやすくなります。
AIへのプロンプト例
過去記事で紹介したGemini用のプロンプトを、テスト評価に応用することもできます。
プロンプト例:
中学2年生の理科「化学変化」の単元で、以下の考察問題の採点基準をルーブリック形式(3段階)で作成してください。
【問題】
実験結果から、鉄と硫黄が化学変化したことをどのように説明できますか。
評価観点:
- 実験結果の記述の正確さ
- 化学変化の理解
- 論理的な説明
武雄市の実践例
武雄市立川登中学校では、英語の発表評価や技術科のプログラミング評価など、数値化しにくい活動の言語化にAIを活用しています。
特に英語科では、「英会話の練習」「英作文の添削」にAIを活用し、生徒個々に合わせた個別最適な学びを実現しています。教員が事前にプロンプトを準備し、生徒がコピー&ペーストで使えるようにすることで、学習が円滑に進む工夫がされています。
このアプローチは、「AIで作成した評価基準を、生徒と共有する」という新しい評価の形につながります。生徒自身が「何を目指せばいいのか」を理解することで、主体的な学びが促進されるのです。

5. 成績所見・通知表コメントの下書き作成
ポイント:教員が最も悩む「言葉選び」をサポート
通知表の所見欄は、保護者にとって子どもの成長を知る貴重な情報源です。しかし、一人ひとりに合った適切な表現を考えるのは、教員にとって大きな負担となっています。
AIは、この「言葉選び」の部分で強力なサポートツールになります。
具体的な活用方法
(1) 箇条書きメモから文章化
まず、生徒の様子を箇条書きでメモし、それをAIに渡して文章化してもらいます。
プロンプト例:
以下のメモをもとに、中学生の通知表にふさわしい所見を150字程度で作成してください。
ポジティブで具体的な表現を使い、今後の励みになる内容にしてください。
【メモ】
- 計算ミスは多いが、解法を見つけるのが早い
- 難問にも諦めずに挑戦する姿勢がある
- グループ学習では友達に教える場面も見られた
AIの出力例: 「数学では、問題の解法を素早く見つけ出す力が際立っています。計算の正確さには改善の余地がありますが、難しい問題にも粘り強く取り組む姿勢は素晴らしいです。グループ学習では、自分の考えを友達に分かりやすく説明する場面も見られ、協働的な学びに貢献しています。今後も、この探究心を大切にしながら、基礎的な計算力を高めていくことを期待しています。」
(2) 「ポジティブで具体的な表現」への変換
過去記事「ルーブリック評価」で紹介した「子どもが自己評価しやすい肯定的な表現」の視点は、所見作成にも応用できます。
NG例: 「授業中の私語が多く、集中力に欠ける」
AI活用後のOK例: 「友達と協力して学ぶ場面では積極性が見られます。一方で、個人作業の時間には、より集中して取り組むことで、さらに力を伸ばせるでしょう」
このように、否定的な表現を避け、「できていること」と「次の目標」をセットで示すことで、建設的なフィードバックになります。
(3) 学年・教科に応じた表現の調整
AIに対して、「小学3年生向け」「中学3年生向け」など、対象を明確に指示することで、年齢に応じた適切な表現を得られます。
プロンプト例:
上記の所見を、小学3年生の保護者向けに書き直してください。
漢字を減らし、より親しみやすい表現にしてください。
注意すべきポイント
最終チェックは必ず教員が行う:AIの出力は「たたき台」です。生徒一人ひとりの個性が反映されているか、必ず確認してください。
個人情報への配慮:生徒の名前や具体的なエピソードを入力する際は、情報管理に注意しましょう。
画一的な表現を避ける:AIが生成した文章をそのまま使い回すと、全員同じような所見になってしまいます。必ず個別の調整を加えてください。

6. 武雄市に学ぶ:実証データが示す効果
ここで、佐賀県武雄市教育委員会が実施した「リーディングDXスクール事業」の実践事例から、具体的な成果を見てみましょう。
武雄市の取り組み概要
武雄市立川登中学校では、校務利用と教育利用の両面で生成AIを導入し、以下のような成果を上げています。

特に注目すべき成果
(1) 管理職のチェック時間短縮
従来、学年だよりや各種文書は、作成者→教務主任→教頭→校長という複数段階のチェックを経ていました。しかし、作成段階でAIによる誤字脱字チェックを行うことで、この確認作業が大幅に効率化されました。
これは、テスト問題の作成においても応用できます。問題を作成した後、AIに「この問題文に誤字や分かりにくい表現はないか」とチェックしてもらうことで、印刷後に誤りが見つかるというリスクを減らせます。
(2) 市内全体での共有システム
武雄市では、Google スプレッドシートを使って、各教員の活用事例(プロンプトと生成結果のリンク)を市内全体で共有しています。
この仕組みにより、「誰かが作った良いプロンプト」を他の教員も活用でき、学校を超えた知識共有が実現しています。テスト作成においても、同様の仕組みを校内や地域内で構築することで、質の高い問題バンクを効率的に蓄積できます。
(3) 生徒の自律的な学び
英語科では、家庭でChatGPTと会話練習をした後、学校でALTとの英会話を行うという反転学習が実施されています。これにより、生徒は「個別最適な学び」を自宅で行い、学校では「協働的な学び」に集中できるようになりました。
この考え方は、テスト準備にも応用できます。AIを使った自己チェック→教員からのフィードバック、という流れを作ることで、評価そのものが学びの一部になります。

7. AI活用時の注意点とチェックリスト
生成AIは非常に便利なツールですが、適切に使わなければ思わぬトラブルにつながることもあります。ここでは、評価業務でAIを活用する際の注意点をまとめます。
情報モラルとファクトチェック
武雄市の実践でも強調されているように、AIが生成した情報は必ずしも正しいとは限りません。
実際の授業実践から
川登中学校では、ChatGPTで佐賀県を紹介するキャラクターを作成し、観光スポットや名産品を紹介させる授業を行いました。すると、実在しない店名や特産品が示され、生徒たちは「AIにも間違いがある」ことを体験的に学びました。
この教訓は、教員がAIを使う際も同様です。

「完璧」を求めすぎない
武雄市の事例でも、「どんなに良いルーブリックを作っても、評価者間で多少の誤差は残る」と述べられています。これはAI活用でも同じです。
最初から完璧なものを作ろうとせず、「たたき台」として活用し、徐々に改善していくという姿勢が大切です。
校内での目線合わせ
AIを使って評価基準を作成した後は、校内の他の教員と「この記述はこのレベルだよね」と確認し合うワークショップを実施することが推奨されます。これにより、評価の標準化がさらに進みます。
8. まとめ:評価業務改革の第一歩
本記事では、テスト作成・採点業務における生成AIの活用方法を、具体的なプロンプト例や実践事例とともに紹介しました。
本記事のポイント
定期テスト作成:AIを「壁打ち相手」にして、問題のたたき台や類題を効率的に作成
採点基準作成:模範解答からキーワードを抽出し、部分点の基準を段階的に明確化
ルーブリック活用:「サンドイッチ法」でパフォーマンス評価の基準を作成し、評価の標準化を実現
通知表所見:箇条書きメモから「ポジティブで具体的な」文章へ変換し、言葉選びの負担を軽減
武雄市の成果:実証データとして、管理職のチェック時間短縮や市内での知識共有の仕組みを紹介
注意点:ファクトチェック、個人情報保護、最終判断は教員が行うことの重要性
評価は「育てる」ためのもの
AIを活用した評価業務改革の本質は、単なる時短ではなく、「評価の質を高めること」にあります。
明確な基準があることで、生徒は「次に何を頑張ればいいのか」が分かります。教員は、浮いた時間を生徒との対話や授業改善に使えます。そして何より、評価そのものが学びの一部になります。
次のアクションステップ
まずは小さく始めてみましょう。
今週のミニテストを、AIに手伝ってもらって作成してみる
次の定期テストの採点基準を、AIと一緒に段階的に作ってみる
過去記事のプロンプトをコピーして、ルーブリックを試作してみる
そして、できれば校内の同僚と共有してみてください。武雄市の事例が示すように、一人で使うよりも、チームで使うことで、AIの効果は何倍にも広がります。
評価業務の改革は、明日からの一歩から始まります。
関連記事・配布素材
▶ ルーブリック評価の基礎と作成方法: 【Geminiプロンプト付】ルーブリック評価とは?「何となく」の評価から卒業する作成手順と実践ガイド
▶ 小学校外国語科での実践例: ChatGPTでつくる!小学校外国語科のルーブリック作成法と実践例
自由ダウンロード素材:どこでも貼れるAI活用の5つの鉄則チェックリスト

<自習ノートについて>
当社では教育機関向けの生成AI導入支援サービスも提供しています。生成AIの導入からその効果的な活用方法、さらに継続的なパフォーマンス分析・改善までを一気通貫でサポートします。
最近開催した生成AI導入セミナーでも、多くの教育現場の方々からご好評いただきました。これからのAI活用にご興味のある方は、ぜひこちらのリンクよりお問合せください。
自習ノートのサービスについての詳細や、お問い合わせはこちらのリンクからどうぞ。それでは、また次回の記事でお会いしましょう!





コメント