Files
aurak/docs/1.0/KNOWLEDGE_BASE_ENHANCEMENTS.md
Developer 0a9588abb7 feat: implement QuestionBank CRUD with pagination and template query
- Add pagination support to findAll (page, limit query params)
- Add findByTemplateId method to service
- Add GET /by-template/:templateId endpoint to controller
- Service already includes CRUD for QuestionBank and QuestionBankItem
2026-04-23 17:19:11 +08:00

465 lines
14 KiB
Markdown

# ナレッジベースの強化機能設計
## 🎯 機能概要
今回の開発には、以下の3つのコア機能が含まれます:
1. **ナレッジベースのグループ化** - グループを作成し、ドキュメントを複数のグループに所属させ、検索時にグループを指定可能にします。
2. **検索履歴** - 対話プロセス全体を保存し、過去の会話の閲覧や再開を可能にします。
3. **PDF プレビュー** - すべてのファイルを PDF 形式に変換し、オンラインでプレビューできるようにします。
## 🗄️ データベース設計
### 新規テーブル構造
```sql
-- ナレッジベースグループ管理テーブル
CREATE TABLE knowledge_groups (
id TEXT PRIMARY KEY,
name TEXT NOT NULL,
description TEXT,
color TEXT DEFAULT '#3B82F6', -- グループの色分けID
user_id TEXT NOT NULL,
created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
updated_at DATETIME DEFAULT CURRENT_TIMESTAMP
);
-- ドキュメント・グループ関連付けテーブル (多対多)
CREATE TABLE knowledge_base_groups (
knowledge_base_id TEXT NOT NULL,
group_id TEXT NOT NULL,
created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
PRIMARY KEY (knowledge_base_id, group_id),
FOREIGN KEY (knowledge_base_id) REFERENCES knowledge_base(id) ON DELETE CASCADE,
FOREIGN KEY (group_id) REFERENCES knowledge_groups(id) ON DELETE CASCADE
);
-- 検索履歴テーブル
CREATE TABLE search_history (
id TEXT PRIMARY KEY,
user_id TEXT NOT NULL,
title TEXT NOT NULL, -- 対話タイトル (質問の先頭50文字)
selected_groups TEXT, -- JSON配列: ["group1", "group2"] または null(すべて)
created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
updated_at DATETIME DEFAULT CURRENT_TIMESTAMP
);
-- 対話メッセージテーブル
CREATE TABLE chat_messages (
id TEXT PRIMARY KEY,
search_history_id TEXT NOT NULL,
role TEXT NOT NULL CHECK (role IN ('user', 'assistant')),
content TEXT NOT NULL,
sources TEXT, -- JSON配列: 引用ソース情報
created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
FOREIGN KEY (search_history_id) REFERENCES search_history(id) ON DELETE CASCADE
);
```
### 既存テーブルの修正
```sql
-- knowledge_base テーブルに PDF パスフィールドを追加
ALTER TABLE knowledge_base ADD COLUMN pdf_path TEXT;
```
## 🔌 API エンドポイント設計
### ナレッジベースグループ API
```typescript
// ユーザーの全グループを取得
GET /api/knowledge-groups
Response: {
groups: Array<{
id: string;
name: string;
description?: string;
color: string;
fileCount: number; // 含まれるファイル数
createdAt: string;
}>
}
// グループの作成
POST /api/knowledge-groups
Body: { name: string; description?: string; color?: string }
Response: { id: string; name: string; description?: string; color: string }
// グループの更新
PUT /api/knowledge-groups/:id
Body: { name?: string; description?: string; color?: string }
// グループの削除
DELETE /api/knowledge-groups/:id
// グループ内のファイルを取得
GET /api/knowledge-groups/:id/files
Response: { files: KnowledgeBase[] }
// ファイルをグループに追加
POST /api/knowledge-bases/:fileId/groups
Body: { groupIds: string[] }
// グループからファイルを削除
DELETE /api/knowledge-bases/:fileId/groups/:groupId
```
### 検索履歴 API
```typescript
// 検索履歴の取得 (ページネーション)
GET /api/search-history?page=1&limit=20
Response: {
histories: Array<{
id: string;
title: string;
selectedGroups: string[] | null;
messageCount: number;
lastMessageAt: string;
createdAt: string;
}>;
total: number;
page: number;
limit: number;
}
// 対話詳細の取得
GET /api/search-history/:id
Response: {
id: string;
title: string;
selectedGroups: string[] | null;
messages: Array<{
id: string;
role: 'user' | 'assistant';
content: string;
sources?: Array<{
fileName: string;
content: string;
score: number;
chunkIndex: number;
}>;
createdAt: string;
}>;
}
// 新しい対話の作成
POST /api/search-history
Body: {
title: string;
selectedGroups?: string[];
firstMessage: string;
}
Response: { id: string }
// 対話の削除
DELETE /api/search-history/:id
// 対話の継続 (既存のチャットインターフェースを拡張し、historyId パラメータを追加)
POST /api/chat/stream
Body: {
message: string;
history: ChatMessage[];
userLanguage?: string;
selectedGroups?: string[]; // 新規:選択されたグループ
historyId?: string; // 新規:対話履歴ID
}
```
### PDF プレビュー API
```typescript
// ファイルの PDF プレビューを取得
GET /api/knowledge-bases/:id/pdf
Response: PDF PDF URL
// PDF ステータスの確認
GET /api/knowledge-bases/:id/pdf-status
Response: {
status: 'pending' | 'converting' | 'ready' | 'failed';
pdfPath?: string;
error?: string;
}
```
## 🎨 フロントエンドコンポーネント設計
### 1. ナレッジベースグループコンポーネント
```typescript
// グループマネージャー
interface GroupManagerProps {
groups: KnowledgeGroup[];
onCreateGroup: (group: CreateGroupData) => void;
onUpdateGroup: (id: string, data: UpdateGroupData) => void;
onDeleteGroup: (id: string) => void;
}
// グループセレクター (検索時の選択用)
interface GroupSelectorProps {
groups: KnowledgeGroup[];
selectedGroups: string[];
onSelectionChange: (groupIds: string[]) => void;
showSelectAll?: boolean;
}
// ファイルグループタグ
interface FileGroupTagsProps {
fileId: string;
groups: KnowledgeGroup[];
assignedGroups: string[];
onGroupsChange: (groupIds: string[]) => void;
}
```
### 2. 検索履歴コンポーネント
```typescript
// 履歴リスト
interface SearchHistoryListProps {
histories: SearchHistoryItem[];
onSelectHistory: (historyId: string) => void;
onDeleteHistory: (historyId: string) => void;
onLoadMore: () => void;
hasMore: boolean;
}
// 履歴対話ビューアー
interface HistoryViewerProps {
historyId: string;
onContinueChat: (historyId: string) => void;
onClose: () => void;
}
```
### 3. PDF プレビューコンポーネント
```typescript
// PDF プレビューアー
interface PDFPreviewProps {
fileId: string;
fileName: string;
onClose: () => void;
}
// PDF プレビューボタン
interface PDFPreviewButtonProps {
fileId: string;
fileName: string;
status: 'pending' | 'converting' | 'ready' | 'failed';
}
```
## 🔄 ビジネスフロー設計
### ナレッジベースグループ化フロー
```
1. ユーザーがグループを作成 → knowledge_groups テーブルに保存
2. ファイルアップロード時 → グループを選択可能 → knowledge_base_groups テーブルに関連付けを保存
3. 検索時 → グループを選択 → Elasticsearch のクエリ範囲をフィルタリング
4. ファイル管理 → ファイルの所属グループを編集可能
```
### 検索履歴フロー
```
1. ユーザーがチャットを開始 → search_history データを生成
2. 各メッセージ → chat_messages テーブルに保存
3. 履歴の確認 → 履歴リストをページネーションでロード
4. 履歴をクリック → 対話内容全体をロード
5. 対話の継続 → 既存の履歴をベースに新しいメッセージを追加
```
### PDF プレビューフロー
```
1. ファイルアップロード → PDF かどうかを確認
2. PDF 以外の場合 → LibreOffice を呼び出して PDF に変換
3. PDF パスを knowledge_base.pdf_path に保存
4. フロントエンドからプレビューをリクエスト → PDF ファイルストリームを返却
5. HTML の <embed> または <iframe> を使用して PDF を表示
```
## 🛠️ 技術実装のポイント
### 1. ES クエリ最適化 (グループフィルタリング)
```typescript
// ElasticsearchService.hybridSearch を修正
async hybridSearch(
queryVector: number[],
queryText: string,
userId: string,
topK: number = 10,
threshold: number = 0.6,
selectedGroups?: string[] // 新規パラメータ
): Promise<any[]> {
// グループフィルタリング条件を構築
const groupFilter = selectedGroups?.length
? { terms: { "knowledge_base_id": await this.getFileIdsByGroups(selectedGroups, userId) } }
: undefined;
// ES クエリにフィルタ条件を追加
const query = {
bool: {
must: [/* 既存のクエリ条件 */],
filter: [
{ term: { user_id: userId } },
...(groupFilter ? [groupFilter] : [])
]
}
};
}
```
### 2. PDF 変換サービスの統合
```typescript
// KnowledgeBaseService に PDF 変換を追加
async ensurePDFExists(kb: KnowledgeBase): Promise<string> {
if (kb.pdfPath && await fs.pathExists(kb.pdfPath)) {
return kb.pdfPath;
}
if (kb.mimetype === 'application/pdf') {
// 既に PDF なので、元のファイルをそのまま使用
kb.pdfPath = kb.storagePath;
} else {
// LibreOffice を呼び出して変換
const pdfPath = await this.libreOfficeService.convertToPDF(kb.storagePath);
kb.pdfPath = pdfPath;
}
await this.knowledgeBaseRepository.save(kb);
return kb.pdfPath;
}
```
### 3. チャット履歴の保存
```typescript
// ChatService.streamChat メソッドを修正
async *streamChat(
message: string,
history: ChatMessage[],
userId: string,
modelConfig: ModelConfig,
userLanguage: string = 'zh',
selectedEmbeddingId?: string,
selectedGroups?: string[], // 新規
historyId?: string // 新規
): AsyncGenerator<{ type: 'content' | 'sources'; data: any }> {
// historyId がない場合は、新しい対話履歴を作成
if (!historyId) {
historyId = await this.createSearchHistory(userId, message, selectedGroups);
}
// ユーザーメッセージを保存
await this.saveChatMessage(historyId, 'user', message);
// ... 既存のロジック ...
// AI の回答を保存
await this.saveChatMessage(historyId, 'assistant', fullResponse, sources);
}
```
## 📱 UI/UX 設計のポイント
### 1. グループ管理インターフェース
- サイドバーにグループリストを表示
- グループへのファイルのドラッグ&ドロップに対応
- グループの色分け表示
- グループ内のファイル数を表示
### 2. 検索インターフェースの強化
- チャット入力欄の上にグループセレクターを追加
- 複数グループの選択と状態表示に対応
- 「全グループ」オプション
### 3. 履歴管理インターフェース
- 左側に履歴リスト、右側に対話内容を表示
- 履歴にはタイトル、時間、メッセージ数を表示
- 履歴の削除と対話の再開をサポート
### 4. PDF プレビュー
- モーダル形式で PDF を表示
- フルスクリーン表示をサポート
- 読み込み状態の表示とエラー処理
## 🚀 開発計画
### ✅ フェーズ1: データベースとバックエンド API (完了)
1. ✅ データベースのマイグレーションスクリプト
2. ✅ グループ管理 API
3. ✅ 履歴管理 API
4. ✅ PDF プレビュー API
5. ✅ チャットサービスの強化 (グループフィルタリングと履歴保存)
6. ✅ Elasticsearch のグループフィルタリング機能
### 🔄 フェーズ2: フロントエンドコンポーネント開発 (進行中)
1. ⏳ グループ管理コンポーネント (基本機能は実装済み。アクセス方法を最適化予定)
2. ⏳ 履歴管理コンポーネント (基本機能は実装済み)
3. ⏳ PDF プレビューコンポーネント (基本機能は実装済み)
4.**UI の刷新と設定の統合**: ヘッダーとサイドバーを整理し、設定の入り口を統一。新機能のためのスペースを確保。
### ⏳ フェーズ3: 統合とテスト (待機中)
1. ⏳ 機能の統合
2. ⏳ エンドツーエンド (E2E) テスト
3. ⏳ パフォーマンスの最適化
---
## ✅ 完了済みのバックエンド開発
### データベース設計
- ✅ 4つの新しいテーブルを作成:`knowledge_groups``knowledge_base_groups``search_history``chat_messages`
-`knowledge_base` テーブルに `pdf_path` フィールドを追加
- ✅ 完全なデータベースマイグレーションスクリプトを作成
### エンティティとサービス
-`KnowledgeGroup` エンティティとサービス (多対多関係をサポート)
-`SearchHistory` および `ChatMessage` エンティティとサービス
-`KnowledgeBase` エンティティを更新し、グループ関係と PDF パスを追加
### API エンドポイント
- ✅ ナレッジベースグループ管理 : `GET/POST/PUT/DELETE /api/knowledge-groups`
- ✅ ファイル・グループ関連付け : `POST/DELETE /api/knowledge-bases/:id/groups`
- ✅ 検索履歴管理 : `GET/POST/DELETE /api/search-history`
- ✅ PDF プレビュー : `GET /api/knowledge-bases/:id/pdf` および `GET /api/knowledge-bases/:id/pdf-status`
### チャット機能の強化
- ✅ グループフィルタリング検索をサポート (`selectedGroups` パラメータ)
- ✅ 対話履歴の自動生成と保存
- ✅ 対話の再開をサポート (`historyId` パラメータ)
- ✅ Elasticsearch によるグループフィルタリングクエリ
### テストと検証
- ✅ 自動テストスクリプト `test-enhancements.sh` を作成
- ✅ すべての API エンドポイントが実装され、テスト可能
**バックエンド開発ステータス**: ✅ **完了** (約 95%)
**次のステップ**: フロントエンドコンポーネントの開発を開始
---
**予想開発期間**: 5〜8日
**優先度**: グループ化機能 > PDF プレビュー > 履歴管理