生成AIによる自社データの活用|学習方法や業務活用事例などを解説


こんにちは。Wakka Inc.メディア編集部です。
近年、生成AIの技術が急速に進化し、多くの企業がその活用に関心を寄せています。
実際に生成AIを導入し、社内業務に活用しているケースも増加しています。
しかし、「自社の機密情報や顧客データを連携させても安全なのか」「具体的な連携方法や導入プロセスが分からない」といった不安から、導入に踏み切れないケースも少なくありません。
また、汎用的な生成AIだけでは、企業固有の課題解決には限界がある点には注意が必要です。
特に自社データを生成AIに活用するなら、適切な導入ステップを踏まなければなりません。
本記事では、生成AIによる自社データの活用について、メリットや学習方法などについて解説します。
また、生成AIの業務活用事例も紹介するので、ぜひ参考にしてください。
WaGAZINE読者さま限定!
生成AIの
生成AIの導入を検討している経営者/マネージャーの方や、
生成AIを使った社内データ活用の有用性

生成AIを使った社内データの活用は、企業にとって有用性が高い取り組みです。
ChatGPTに代表される生成AIは、テキスト生成・コーディング・翻訳や要約など、さまざまな形で活用できます。
昨今はAIとのチャットを通じてアイデア出しや壁打ちに活用するなど、アシスタントとして活用されるケースも増加しました。
その結果、業務の効率化・社内データのより深い分析・従業員の負担軽減など、さまざまな効果が期待できます。
加えて、生成AIの効果をより高めるうえで、社内データを活用する取り組みも積極的に実践されています。
企業が長年蓄積してきた業務マニュアル・顧客とのやり取り・技術ノウハウといった「自社データ」は、他社にはない独自の競争力の源泉です。
社内データを生成AIと連携させることで、最新情報・専門知識・自社特有の情報まで網羅した、より高度なAI活用が実現します。
例えば、顧客からの問い合わせ対応を自動化する際に、過去の対応履歴やFAQをAIに学習させることで、より的確でパーソナライズされた回答が可能です。
また、技術的な課題においても、社内に保管された技術文書や過去の事例をAIが分析し、最適な解決策を提示することで、スピーディーな解決が期待できます。
自社データを生成AIで活用するメリット

生成AIによる自社データの活用で期待できるメリットは、以下の通りです。
- 生産性の向上や業務の効率化を実現できる
- 業界・業種に特化した出力ができる
- ハルシネーションのリスクを減らせる
- 最新情報を反映できる
- コンプライアンスを強化できる
- 従業員の研修に活用できる
それぞれのメリットについて、順番に解説します。
生産性の向上や業務の効率化を実現できる
生成AIは、業務効率化と生産性向上に直接的な恩恵をもたらすツールです。
報告書やメールの自動作成・データ分析・要約や翻訳などによって、従業員は非コア業務による負担から解放され、コア業務に集中しやすくなります。
特に、書類作成などの事務作業が日常的に発生する業務であれば、生成AIの効果は絶大です。
ルーティン業務が全般的に自動化されれば、業務負担が減るだけでなく、少ない人員で一定以上の生産性を実現する体制を構築できます。
生産性の向上や業務の効率化は、企業の競争力を引き上げる重要な要素です。
企業の成長戦略を策定するうえでも、生成AIは多大な貢献が期待できます。
業界・業種に特化した出力ができる
自社データを生成AIで活用できれば、業界・業種に特化した出力が可能です。
業界・業種によっては、高度な専門性が求められる業務が少なくありません。
従業員の業務効率化を図りたくても、専門性の高さがハードルになるケースも十分に想定されます。
生成AIで自社データを活用できるようにすれば、業界特有の専門用語や企業独自のルールに精通した回答が可能になります。
自社の状況に即した高精度な回答を生成できる生成AIになれば、業界・業種独自の課題にも対応しやすくなり、より高度な課題の解決も可能です。
また、属人化の防止やノウハウの平準化にも役立てられます。
ハルシネーションのリスクを減らせる
自社データを生成AIで活用すれば、ハルシネーションのリスクをある程度減らせる可能性があります。
一般的に利用される汎用性が高い生成AIは、専門性が欠如しているため、誤った情報を出力するハルシネーションのリスクが少なくありません。
しかし、生成AIにあらかじめ自社データを学習させれば、業界・業種の実情に即した回答が可能です。
専門的な知識を網羅した生成結果を業務に活用できるため、ハルシネーションによる誤情報の拡散や判断ミスを防止できます。
最新情報を反映できる
生成AIによる自社データの活用は、最新情報の反映においても有効です。
市場の動向や社内ルールは常に変化するため、情報の鮮度が重要です。
一般的な生成AIは学習データに依存し、その知識は特定の時点で止まっています。
しかし、自社データを生成AIと連携させる仕組みを構築することで、最新の市場データ・更新された社内規定・リアルタイムの顧客フィードバックなどを回答に反映させられます。
これにより、古い情報や誤った知識に基づくリスクを軽減可能です。
コンプライアンスを強化できる
社内規定や関連法規、業界のガイドラインなどを生成AIに学習させることは、コンプライアンスの強化にもつながる取り組みです。
生成AIは、常に最新の情報を反映し、変化する法規制や社内ルールに迅速に対応できるため、人為的な見落としや解釈の誤りを防ぎます。
また、従業員が業務上の判断に迷った際、AIに問い合わせることで、関連するルールに基づいた適切なアドバイスを迅速に得られます。
これにより、コンプライアンス違反のリスクを低減できるだけでなく、担当部署への確認時間や担当者の負担の軽減が可能です。
さらに、生成AIを通じて判断の根拠となったルールや関連情報を提示することで、従業員は理解を深められるため、コンプライアンス意識の向上にも貢献できるのもメリットです。
加えて内部統制の強化やリスク管理の効率化にも貢献し、持続的な企業成長を支えます。
従業員の研修に活用できる
生成AIに自社のノウハウを学習させれば、組織全体の知識ベースの向上が可能です。
データ化された知識は、強力な教育ツールとして活用できます。
特に、新入社員や経験の浅い社員は、業務を進めるうえで分からないことや疑問点が生じた場合、時間や場所を選ばずに生成AIに質問できます。
生成AIは、蓄積された知識に基づいて、対話形式で必要な情報を提供し、業務知識の習得をサポートできるため、OJT担当者の負担軽減が可能です。
より高度な指導やメンタリングはOJT担当者が、業務に関する簡単な質問やサポートを生成AIに任せることで、研修の質を均一化しながら、組織全体の効率的なスキルアップを促進できます。
また、生成AIによる学習履歴を分析することで、個々の社員の強みや弱みを把握し、よりパーソナライズされた教育プログラムも実現できます。
生成AIへの自社データ学習方法

生成AIに自社データを連携させる学習方法は、大きく分けて以下の3点です。
- プロンプト入力
- ファインチューニング
- RAG(検索拡張生成)
それぞれにメリットとデメリットがあるため、目的や予算、技術レベルに応じて最適な方法を選択することが重要です。
プロンプト入力
プロンプト入力はもっともシンプルな学習方法です。
ChatGPTなどの対話画面に、質問と合わせて参照してほしい自社データを直接コピー&ペーストして入力します。
特別なツールや専門知識が不要で、誰でも手軽に試せるのが最大のメリットです。
しかし、毎回手動で入力する手間がかかるうえ、入力できる文字数に制限があります。
また、複雑な質問に対しては具体的なプロンプトを入力する必要があるため、ある程度のノウハウが求められる点にも注意しましょう。
加えて、機密情報を直接入力するので、入力内容を学習する生成AIだと、情報漏洩のリスクが高まります。
ファインチューニング
ファインチューニングは、既存のAIに自社独自のデータセットを追加学習させ、特定の業務や業界に特化した高精度なAIモデルを育成する手法です。
これは、汎用的なAIモデルでは対応しきれない、専門性の高いニーズに応えるうえで効果が期待できます。
ファインチューニングは、生成AIの精度を向上させるうえで有効な手法です。
自社データで学習させることで、AIモデルはより具体的なタスクやデータパターンを学習し、汎用モデルでは得られない高いパフォーマンスを発揮します。
例えば、顧客対応AIに自社の顧客データに基づいて学習させれば、より自然で適切な応答が可能です。
ファインチューニングを実践するには、高品質な学習用データが不可欠ですが、必要な量を準備するには多大な労力がかかり、データの収集・整理・アノテーションといった作業が必要です。
そのため、一定以上の労力やコストが求められます。
また、追加学習には高性能な計算リソース(GPU)と機械学習に関する高度な専門知識が欠かせません。
しかし、自社で必要な計算リソースや専門知識を持った人材を確保するのは容易ではありません。
ファインチューニングを成功させるためには、十分な準備と計画が重要です。
RAG(検索拡張生成)
RAG(Retrieval-Augmented Generation)は、多くの企業から注目されている方法です。
RAGはAIモデル自体に直接データを学習させるのではなく、質問が来たタイミングで社内のデータベースから関連情報を検索し、その検索結果を参考にしてAIが回答を生成する方式を取っています。
つまり、生成AIに回答を検討させるのではなく、データベースの内容や、AIの検索機能を強化することで、より高精度な回答の実現を目指す方法です。
生成AIに機密情報を記憶させないため、セキュリティリスクを大幅に低減できる点が大きなメリットです。
さらに、データベースを更新するだけで、AIの回答に最新の情報を反映させられます。
また、ノウハウが求められるファインチューニングと違い、RAGは導入コストや必要な専門知識のハードルが低く、専門的なAIエンジニアがいなくても、比較的容易に導入・運用できます。
そのため、初めて生成AIを活用する企業でも導入しやすいのも魅力です。
RAGは既存のデータベースを活用しながら、生成AIの効果を最大限に引き出せるため、費用対効果の高いソリューションとして人気を集めています。
RAG(検索拡張生成)の仕組みとデータ連携プロセス

本章ではRAGの仕組み・データ連携プロセスについて解説します。
実際にRAGを実施する際の参考にしてください。
ベクトルデータベース構築
ベクトルデータベースとは、生成AIが理解しやすい形に整理されたデータベースです。
ベクトルデータベースは以下のプロセスで構築されます。
※表は横にスクロールできます。
| 作業名 | 作業内容 |
| チャンキング | 文書を意味のまとまり(段落など)ごとに小さな単位に分割します。 |
| ベクトル化 | 分割した各文書の断片を、「ベクトル」と呼ばれる数値の配列に変換します。このベクトルは、文章の意味や文脈を数値的に表現したもので、意味が近い文章ほどベクトル空間上で近い位置に配置されます。 |
| 格納 | 変換されたベクトルデータを、専用のベクトルデータベースに索引情報として保存します。 |
セマンティック検索
セマンティック検索はRAGが採用する検索方式です。
この検索方式は、ユーザーから質問が入力された際、生成AIが単なるキーワードの一致ではなく、質問の「意味」や「意図」を理解して関連情報を探し出す点が特徴です。
検索エンジンのようなキーワード検索と異なり、単語や文章の意味的な近さを重視して検索することで、入力内に誤りがあっても、関連情報の抽出がスムーズにできます。
また、検索漏れを防げるため、必要な情報をスムーズにチェックしたいときに便利です。
なお、セマンティック検索はベクトルデータベースを前提にした検索方式です。
生成AIは質問文を同じようにベクトルに変換し、ベクトルデータベース内でもっとも意味が近い関連情報を複数見つけ出します。
プロンプト生成とLLMによる回答
セマンティック検索によって見つけ出した関連情報は、ユーザーの元の質問を組み合わせ、LLM(大規模言語モデル)に最終的な回答を生成させます。
LLMは、検索を通じて集められた関連情報を統合し、質問の内容に結び付けたうえで文章を生成する役割を担う機能です。
LLMはユーザーのプロンプトに従って文章を生成しますが、参照元を抽出した関連情報に限定します。
そのため、ハルシネーションを防ぎ、根拠に基づいた信頼性の高い回答の生成が可能です。
自社データを生成AIに学習させる手順

生成AIに自社データを学習させる手順は以下の通りです。
- Step1:目的とユースケースの明確化
- Step2:データ整備と準備
- Step3:技術選定とセキュアな環境構築
- Step4:PoC(概念実証)と効果検証
- Step5:本格展開と継続的な運用
それぞれの手順について、順番に解説します。
Step1:目的とユースケースの明確化
最初に、生成AIを導入する目的やユースケースを明確に定義しましょう。
曖昧な動機で生成AIを導入しても必要な機能や活用方法が分からず、想定していた効果が発揮されないことになります。
目的とユースケースを明確にする際は、具体的な目標を想定しましょう。
例えば、以下のように目標を設定すると分かりやすくなります。
- 社内ヘルプデスクへの問い合わせ工数を30%削減する
- 営業担当者の提案書作成時間を平均2時間短縮する
上記のように具体的な数値を交えて目標を設定すると、KPIの設定が円滑になるため、定量的な効果測定が可能です。
また、ユースケースが明確になるため、導入する生成AIに必要な機能や、自社データの選定もスムーズに進められます。
なお、目標の内容に関わらず、生成AIの導入はスモールスタートがおすすめです。
スタートから全社展開を進めると、従業員が混乱したり、トラブルがあった際の手戻りが困難になったりする恐れがあります。
最初は総務に関連する業務の効率化や、人事部門向けのFAQチャットボットなど、対象範囲が限定的で効果が見えやすい領域から始めましょう。
限定的な範囲で成功を収めることで、他の部署への展開もスムーズに進められます。
Step2:データ整備と準備
生成AIに学習させる自社データの整備や準備も重要なプロセスです。
生成AIの性能は、学習データの質に大きく左右されます。
データの質が低いと、AIの出力も質の低いものになるため、社内のファイルサーバーや、各種システムに散在している関連データを収集し、統合する作業は重要です。
さらに、データ形式の統一・誤字脱字の修正・情報の更新などといった、データクレンジングの作業も欠かせません。
生成AIの効果を最大限発揮させるには、良質なデータの学習が必須です。
自社データを適切に活用するためにも、データの整備は入念に行いましょう。
Step3:技術選定とセキュアな環境構築
目的設定とデータ準備が完了したら、次のプロセスは技術選定とセキュアな環境構築です。
まずは生成AIを構築する方法を検討します。
例えば、RAGの導入にあたっては、利用目的に合致したアーキテクチャを選定することが重要です。
社内FAQシステムであればシンプルな構成で十分ですが、顧客対応を自動化する場合は、より高度な機能が求められます。
生成AIを活用する業務をイメージしながら、最適なプロセスを設定しましょう。
続いて、利用するデータソースの特性を考慮し、適切なデータ加工処理を行います。
テキストデータだけでなく、画像や音声データも活用する場合は、それぞれのデータ形式に合わせた処理が必要です。
また、生成AIを運用するにあたって、セキュリティを確保できる環境の構築は欠かせません。
機密情報を扱う場合は、外部からアクセスできない社内ネットワークや、特定の利用者のみがアクセスできる閉域網クラウドなどを利用し、情報漏洩のリスクを徹底的に排除しましょう。
さらに、アクセス制御や暗号化などのセキュリティ対策を講じることで、より安全な環境を構築できます。
なお、一連の作業はノウハウがない企業だと実施が困難です。
必要に応じて、AI導入の実績がある専門家の力を借りましょう。
Wakka Inc.では、自社データと生成AIを掛け合わせたシステム開発の実例が豊富にあります。
具体的な活用アイデアやつまずきがちなポイントから丁寧にご相談に乗りますので、ぜひお気軽にお問い合わせください。
WaGAZINE読者さま限定!
生成AIの
生成AIの導入を検討している経営者/マネージャーの方や、
Step4:PoC(概念実証)と効果検証
生成AIを導入する際は、限定された部門やチームでPoCを実施しましょう。
PoCとは、Proof of Conceptの略称であり、「概念実証」を意味する用語です。
開発、あるいは導入予定のシステムやツールの効果や実現可能性を実証する検証プロセスを指します。
PoCを実践することにより、実際の利用を通して操作性や回答精度に関するフィードバックを収集し、改善点を見つけられます。
あわせて、具体的な目標に応じて設定されたKPIと合わせれば、より詳細な効果測定が可能です。
PoCの結果が出たら、徹底的に分析し、明らかになった課題や改善点を洗い出すことで、本格導入に向けて生成AIのクオリティや運用体制の完成度を高めましょう。
この検証と改善のサイクルを繰り返すことで、システムが実際の業務に適合し、期待される効果を最大限に発揮できる状態が実現しやすくなります。
Step5:本格展開と継続的な運用
PoCで有効性が確認できれば、本格的な展開へ移行します。
しかし、全社一斉展開はリスクが高いため、関連部署から段階的に対象範囲を拡大していくスモールスタートを心がけましょう。
また、生成AIを運用するにあたり、ガイドラインの策定や、自社データの定期的な更新も不可欠です。
いずれも、生成AIの適切な利用を促進し、精度を維持・向上させるうえで重要です。
さらに、利用状況を監視し、トラブル発生時に迅速に対応できる運用体制も構築しましょう。
生成AIは導入後も継続的なメンテナンスと改善が必要であり、運用体制の構築が欠かせません。
生成AIの業務活用事例10選

本章では、実際に生成AIを業務に活用した事例を紹介します。
事例は以下の通りです。
- KDDI株式会社|全社を挙げてAIの業務での活用を推進
- パナソニックコネクト株式会社|生成AIで労働時間を短縮
- 株式会社セブンイレブン・ジャパン|発注を補助する専用AIを導入
- LINEヤフー株式会社|生成AIによるコーディング補助を実施
- 日本航空株式会社|専用の社内AIを独自開発
- 農研機構|農業に特化した専用のAIを開発
- 西松建設株式会社|文章生成AIを積極的に活用
- SMBCグループ|自社専用のAIアシスタントで業務を効率化
- 株式会社みずほフィナンシャルグループ|自社で利用する金融特化型AI開発を推進
- ヤマト運輸株式会社|AIによる配送業務量予測で配送を効率化
いずれの事例も社内データを独自の方法で活用しています。
それぞれの事例から、自社の課題解決のヒントをつかみましょう。
KDDI株式会社|全社を挙げてAIの業務での活用を推進
KDDI株式会社は、2023年から全社を挙げてAIの業務活用を推進しました。
グループに属する1万人の従業員が使用できる社内用AI「KDDI AI-Chat」を導入し、さまざまな業務での活用を促進しています。
社内用AIの導入効果はめざましく、プログラミングに要する作業時間の短縮など、さまざまな成果を挙げました。
さらに、KDDI株式会社は生成AI活用による成果を競い合う社内コンテストを実施することで、新たな活用方法を模索しています。
参照:KDDIが実践する「生成AI活用」の現在地と未来ビジネス展開を見据え、社内プロジェクトを推進|KDDI株式会社
パナソニックコネクト株式会社|生成AIで労働時間を短縮
パナソニックコネクト株式会社は、生成AIによる労働時間の短縮を成功させた好例です。
同社は、社内向けのAIアシスタントサービス「ConnectAI」を導入し、以下の3点の目標達成を目指して運用を開始しました。
- 生成AIによる業務生産性向上
- 社員のAIスキル向上
- シャドーAI利用リスクの軽減
運用の結果、1年間で業務時間を18.6万時間も削減するなど、多大な成果を挙げています。
同社は、さらにプロンプト添削機能を追加することで、より効率的な運用を実現するなど、生成AIの運用をさらに推進しています。
参照:パナソニック コネクト 生成AI導入1年の実績と今後の活用構想|パナソニックコネクト株式会社
株式会社セブンイレブン・ジャパン|発注を補助する専用AIを導入
大手コンビニチェーンの株式会社セブンイレブン・ジャパンでは、店内作業効率化のために、専用AIを導入しました。
当該AIは過去の需要予測から最適な在庫数を算出し、自動で発注する機能を備えているものです。
同社が導入した専用AIは品切れのリスクを予防するだけでなく、従業員の発注入力時間を40%削減するなど、業務負担の軽減にも役立ちました。
参照:店内作業効率化の取り組み|株式会社セブンイレブン・ジャパン
LINEヤフー株式会社|生成AIによるコーディング補助を実施
2023年、LINEヤフー株式会社は、開発業務に関わる約7,000名のエンジニア向けに、コーディング補助のための生成AI導入を決定しました。
当該AIは最適なコーディングの提案に加え、エラーや最適化のポイントを精査するなど、エンジニアの業務効率化に特化したものです。
同社が導入した生成AIはコーディングの作業時間を減らし、アクティビティの向上に貢献しました。
一方、LINEヤフー株式会社は生成AIの導入にあたって、著作権侵害などのリスクを回避するために、eラーニングを実施するなど、徹底した研修を実施していた点も特徴です。
参照:LINEヤフーの全エンジニア約7,000名を対象にAIペアプログラマー「GitHub Copilot for Business」の導入を開始|LINEヤフー株式会社
日本航空株式会社|専用の社内AIを独自開発
JALこと、日本航空株式会社は「JAL-AI」と呼ばれる社内AIをアバナード株式会社とともに開発しました。
JAL-AIはDX推進の一環として開発され、社内データを効率的に運用できるように優れたRAGを導入するなど、社内の業務支援に特化している点が特徴です。
さらに、日本航空株式会社は空港業務に特化した「空港JAL-AI」を開発するなど、さらなる業務効率化を目指しています。
参照:JALグループの社内業務を自動化、効率化する独自の生成AIツール「JAL-AI」の開発を支援|アバナード株式会社
農研機構|農業に特化した専用のAIを開発
農研機構は国内の農業に特化した専用AIを開発したことで話題を呼びました。
当該AIは農業知識を重点的に学習しており、汎用的な一般向けの生成AIと比較すると、正答率が40%向上するなど、高い精度を実現しています。
農研機構は2024年10月から三重県での試験運用を開始し、性能をブラッシュアップしつつ、段階的な全国展開を目指しています。
参照:(研究成果) 国内初の農業特化型生成AIを開発|農研機構
西松建設株式会社|文章生成AIを積極的に活用
西松建設株式会社はセキュアな文章生成AIを導入し、業務効率化と品質向上に取り組んでいます。
導入された生成AIは高い文章作成能力を持つだけでなく、高度な専門性を要する社内文書の生成や、技術文書の作成支援も可能とするなど、同社の業務支援に特化している点が特徴です。
西松建設株式会社は、専用機能の開発を目指すなど、生成AIの活用をさらに推進することを表明しています。
SMBCグループ|自社専用のAIアシスタントで業務を効率化
SMBCグループは自社専用のAIアシスタント「SMBC-GAI」を開発するなど、独自のDX推進が話題になりました。SMBC-GAIはTeamsに組み込まれる形で運用され、社内のさまざまな業務のサポートを実施します。
なお、SMBCグループは開発だけでなく、運用ルールの策定にも時間をかけていました。
マニュアルの作成などを徹底することにより、最適な運用体制の構築に成功しています。
参照:SMBCグループが独自に生み出したAIアシスタント「SMBC-GAI」開発秘話|SMBCグループ
株式会社みずほフィナンシャルグループ|自社で利用する金融特化型AI開発を推進
株式会社みずほフィナンシャルグループは、NTTデータグループと共同研究契約を締結し、金融に特化した「〈みずほ〉特化型モデル」の構築を目指しています。
元々同社では社内用AIアシスタントを導入していましたが、現在の情勢や市場の変化に鑑み、生成AIを競争力向上のために本格的に導入することを宣言しました。
より革新的なソリューションを生み出す生成AIの開発が期待されています。
ヤマト運輸株式会社|AIによる配送業務量予測で配送を効率化
ヤマト運輸株式会社はAIを活用し、配送業務量を予測することで効率化を実現しました。
この取り組みは、アルフレッサ株式会社との業務提携によって実施されています。
ビッグデータとAIを組み合わせることにより、精度が高い配送業務量予測を実現したことは、当時業界でも大きな話題になりました。
さらに同社のノウハウを最大限活用し、配送生産性の向上や走行距離の削減など、さまざまな成果を挙げました。
ビッグデータ・AIを活用した配送業務量予測および適正配車のシステム導入について|ヤマト運輸株式会社
自社データを活用してより有用な生成AIを実現しよう
生成AIによる自社データの活用は、業界・業種に特化した高度な業務に対応するうえで有用です。
適切な運用を実現すれば、生産性の向上や業務の効率化が期待できます。
しかし、自社データの活用は生成AIの性質を理解し、自社に最適な学習方法を選定するなど、さまざまなステップがあります。
もし、社内リソースだけでの対応が難しいなら、ぜひWakka Inc.にご相談ください。
多くの企業のIT戦略をサポートしてきた豊富な実績とノウハウを活用し、最適なサポートを提供します。
WaGAZINE読者さま限定!
生成AIの
生成AIの導入を検討している経営者/マネージャーの方や、









