名前や住所を入力するのはNG?...「AIのプロ」は入力する情報・しない情報をこう分ける
そのため、本当に機密性の高い情報を扱う場合は、チャット履歴を定期的に削除する、一時的なチャット機能を活用する、あるいはそもそも入力しない、データをダミーデータに置き換えるといった判断も必要になります。
データの保存先の2段階目は、生成AIのモデル(大規模言語モデル)への学習です。こちらは全く異なる仕組みで、モデルの学習へ統計的に反映されるものの、個人を特定できる形では保存されないケースが多いです。
実は、生成AIへの学習という観点では過度な心配は不要である、という主張もあります。これはなぜでしょうか。
生成AIへの学習において個人情報はそのまま「保存されない」
生成AIの学習は、多くの方が想像するような「データベースのように個人情報をそのまま保存する」仕組みではありません。
入力したテキストはサブワード単位(トークン化)に分割されます。
例えば「田中太郎」という名前は「田」「中」「太」「郎」といった個別の文字に分割され、これらは他の文字と組み合わせて別の単語の形成にも使用されます。そのため、元の個人情報としての識別性は大きく失われます。
モデルが最終的に保存するのは、個人データそのものではなく「ワード間の確率的関係パターン」のみです。つまり「この文脈では次にこの言語が来やすい」という統計的な傾向を学習するのであって、あなたの具体的な文書内容を記憶するわけではありません。
-
生成AI商材/大手外資系「インサイドセールス「SV候補」」/その他コンサルティング系
ブリッジインターナショナル株式会社
- 東京都
- 年収340万円~450万円
- 正社員
-
東京都港区/外資系企業での一般事務・庶務業務
日本アスペクトコア株式会社
- 東京都
- 月給22万700円~
- 正社員
-
「DDGC」グローバルアカウントプランナー「外資ラグジュアリーブランド担当/オンオフ統合領域」/リモート/在宅勤務可/2696
株式会社電通デジタル
- 東京都
- 年収400万円~1,000万円
- 正社員
-
保険の営業 外資系トップクラスの大手グループ/土日祝休み/年間休日120日以上/手厚い研修あり
マニュライフ生命保険株式会社
- 東京都
- 月給20万円~50万円
- 正社員





