# Cơ sở tri thức

> Tạo và quản lý cơ sở tri thức để cung cấp tài liệu tham khảo cho Trợ lý AI.

**Quyền truy cập:** Cần quyền **Xem danh sách Knowledge Base**, **Tạo Knowledge Base**, **Cập nhật Knowledge Base**, **Xoá Knowledge Base** **Điều hướng:** `Trợ lý AI > Cơ sở tri thức` hoặc `/manage/ai/knowledge-bases`

***

## Tổng quan

Cơ sở tri thức (CS Tri thức) là nơi lưu trữ tài liệu để Trợ lý AI tham khảo khi trả lời câu hỏi. Mỗi site được tạo tối đa **30 CS Tri thức**.

Hệ thống sử dụng công nghệ **vector embedding** để chuyển đổi văn bản thành vector, cho phép tìm kiếm ngữ nghĩa (semantic search) thay vì chỉ tìm kiếm từ khóa.

***

## Giao diện

Trang **Cơ sở tri thức** có 2 tab:

| Tab           | Chức năng                                                                                   |
| ------------- | ------------------------------------------------------------------------------------------- |
| **Tổng quan** | Thống kê nhanh: tổng số CS Tri thức, số đang hoạt động, số tài liệu, số Trợ lý đang sử dụng |
| **Danh sách** | Danh sách CS Tri thức, tìm kiếm, tạo mới                                                    |

Thanh trên cùng của tab Danh sách hiển thị số CS Tri thức đã tạo / giới hạn (ví dụ: `Đã tạo: 5/30 (Còn lại: 25)`).

***

## Các loại cơ sở tri thức

| Loại                       | Mô tả                                                             |
| -------------------------- | ----------------------------------------------------------------- |
| **Tài liệu** (documents)   | Cơ sở tri thức từ file tài liệu. Đây là loại mặc định khi tạo mới |
| **Toàn hệ thống** (site)   | Tri thức chung chia sẻ cho toàn hệ thống, thông tin công ty       |
| **Theo khóa học** (course) | Tri thức riêng cho từng khóa học, phạm vi giới hạn                |
| **Công khai** (public)     | Tri thức công khai, tất cả người dùng đều có thể truy cập         |

***

## Nguồn dữ liệu hỗ trợ

| Nguồn                 | Định dạng               |
| --------------------- | ----------------------- |
| **Tệp tin**           | PDF, DOCX, TXT, MD      |
| **Văn bản trực tiếp** | Văn bản thuần, Markdown |

**Giới hạn dung lượng:** Tối đa 50 MB mỗi file.

***

## Tạo cơ sở tri thức mới

### Điều kiện

* Có quyền **Tạo Knowledge Base**
* Chưa đạt giới hạn 30 CS Tri thức
* Site đã kích hoạt tính năng AI

### Các bước

1. Điều hướng đến `Trợ lý AI > Cơ sở tri thức`
2. Chuyển sang tab **Danh sách**
3. Nhấp **"Tạo Cơ sở tri thức"** ở góc phải trên

> **Lưu ý:** Nút bị vô hiệu hóa nếu đã đạt giới hạn 30 CS Tri thức. Di chuột vào nút sẽ thấy thông báo "Đã đạt giới hạn 30 Cơ sở tri thức".

4. Trong hộp thoại tạo mới, điền các trường:

| Trường   | Bắt buộc | Mô tả                                                     |
| -------- | -------- | --------------------------------------------------------- |
| **Tên**  | Có       | Tên hiển thị của CS Tri thức, ví dụ: "Chính sách nhân sự" |
| **Loại** | Có       | Mặc định là **Tài liệu**                                  |

5. Nhấp **OK** để tạo.

### Sau khi tạo

Hệ thống thực hiện tuần tự:

1. **Tạo CS Tri thức cục bộ** -- Lưu thông tin với trạng thái **Chờ xử lý**
2. **Tạo CS Tri thức trên máy chủ AI** -- Gọi Gradient API để tạo Knowledge Base từ xa
3. **Cập nhật trạng thái** -- Chuyển thành **Đang hoạt động** nếu thành công, hoặc **Lỗi** nếu thất bại

***

## Trang cài đặt cơ sở tri thức

Nhấp **"Cài đặt"** trong danh sách CS Tri thức để mở trang cài đặt tại `/manage/ai/knowledge-bases/:id/setting`. Trang gồm 3 tab:

| Tab           | Mô tả                                      |
| ------------- | ------------------------------------------ |
| **Tổng quan** | Thông tin cơ bản, ảnh đại diện, trạng thái |
| **Dữ liệu**   | Quản lý tài liệu đã tải lên                |
| **Indexing**  | Lịch sử và trạng thái các job đánh chỉ mục |

### Tab Tổng quan

Hiển thị tên CS Tri thức, trạng thái, ảnh đại diện (thumbnail). Cho phép thay đổi thumbnail từ thư viện media. Nút **"Xoá"** ở góc phải trên để xoá CS Tri thức vĩnh viễn.

### Tab Dữ liệu

Quản lý tài liệu trong cơ sở tri thức:

* **Tải file lên** -- Kéo thả hoặc chọn file (PDF, DOCX, TXT, MD, tối đa 50 MB)
* **Nhập văn bản** -- Nhập trực tiếp nội dung văn bản/Markdown
* **Danh sách tài liệu** -- Bảng hiển thị tên, dung lượng, trạng thái indexing
* **Xoá tài liệu** -- Xoá file khỏi CS Tri thức
* **Hàng đợi chờ** -- Tài liệu đang chờ xử lý khi có job đang chạy

Trước khi tải lên, hệ thống hiển thị hộp thoại **ước tính chi phí** gồm: số token ước tính, chi phí VND, số dư ví hiện tại.

### Tab Indexing

Lịch sử các job đánh chỉ mục, mỗi job hiển thị: trạng thái, số token xử lý, chi phí, model embedding, thời gian. Có thể làm mới danh sách bằng nút **"Tải lại"**.

***

## Quản lý tài liệu trong CS Tri thức

### Thêm tài liệu

1. Vào trang **Cài đặt** của CS Tri thức (nhấp nút "Cài đặt" trong danh sách)
2. Chuyển sang tab **Dữ liệu**
3. Tải lên file hoặc nhập văn bản trực tiếp
4. Hệ thống tự động tạo **indexing job** để xử lý và đánh chỉ mục tài liệu

> **Lưu ý:** Trước khi tải lên, hệ thống kiểm tra số dư ví credit. Nếu không đủ credit, thao tác sẽ bị từ chối.

### Ước tính chi phí

Hệ thống cung cấp chức năng **ước tính chi phí indexing** trước khi tải lên:

* Tính theo số lượng token của tài liệu
* Sử dụng model embedding để tính
* Hiển thị chi phí bằng VND

### Hàng đợi xử lý

Khi đã có một indexing job đang chạy, các tài liệu mới sẽ được thêm vào **hàng đợi chờ** (pending ingest queue). Hệ thống xử lý tuần tự từng tài liệu.

Các thao tác với hàng đợi:

| Thao tác             | Mô tả                                          |
| -------------------- | ---------------------------------------------- |
| Thêm vào hàng đợi    | Thêm tài liệu vào hàng chờ                     |
| Xóa khỏi hàng đợi    | Xóa tài liệu chưa xử lý                        |
| Cập nhật thông tin   | Sửa tên hoặc thông tin tài liệu trong hàng đợi |
| Xóa toàn bộ hàng đợi | Xóa tất cả tài liệu đang chờ                   |

### Xóa tài liệu

* Cần quyền **Cập nhật Knowledge Base** hoặc **Xoá Knowledge Base**
* Tài liệu bị xóa sẽ không còn được tham khảo bởi Trợ lý AI

### Tìm kiếm tài liệu

* Tìm kiếm theo tên file
* Lọc theo phần mở rộng (extension)
* Hỗ trợ phân trang

***

## Trạng thái cơ sở tri thức

| Trạng thái         | Ý nghĩa                          |
| ------------------ | -------------------------------- |
| **Chờ xử lý**      | Vừa tạo, chưa gửi lên máy chủ AI |
| **Đang khởi tạo**  | Đang khởi tạo trên máy chủ AI    |
| **Đang hoạt động** | Đang hoạt động, sẵn sàng sử dụng |
| **Lỗi**            | Lỗi, cần kiểm tra cấu hình       |

***

## Trạng thái indexing job

Mỗi tài liệu khi được thêm vào sẽ tạo một **indexing job** để đánh chỉ mục:

| Trạng thái            | Ý nghĩa                                                           |
| --------------------- | ----------------------------------------------------------------- |
| **Hoàn tất**          | Đánh chỉ mục thành công                                           |
| **Không có thay đổi** | Không có thay đổi                                                 |
| **Hoàn tất một phần** | Đánh chỉ mục một phần                                             |
| **Thất bại**          | Thất bại — hệ thống hiển thị lý do lỗi màu đỏ bên dưới trạng thái |
| **Lỗi**               | Lỗi — hệ thống hiển thị lý do lỗi màu đỏ bên dưới trạng thái      |

> **Lưu ý:** Khi trạng thái là **Thất bại** hoặc **Lỗi**, hệ thống tự động hiển thị lý do lỗi (error reason) bằng chữ đỏ ngay bên dưới badge trạng thái trong danh sách. Di chuột vào dòng lỗi để xem toàn bộ nội dung nếu bị cắt ngắn.

Thông tin indexing job bao gồm:

| Trường        | Mô tả                   |
| ------------- | ----------------------- |
| totalTokens   | Tổng số token đã xử lý  |
| costBaseUSD   | Chi phí gốc (USD)       |
| costFinalVND  | Chi phí cuối cùng (VND) |
| modelId       | Model embedding sử dụng |
| queuePosition | Vị trí trong hàng đợi   |

***

## Thống kê sử dụng

Hệ thống cung cấp báo cáo sử dụng cho từng CS Tri thức và toàn bộ hệ thống:

* **Theo CS Tri thức:** Tổng hợp chi phí indexing, số token, số tài liệu đã xử lý
* **Toàn hệ thống:** Tổng hợp trên tất cả các CS Tri thức

Cần quyền **Xem thống kê sử dụng AI** hoặc **Xem chi tiết Knowledge Base** để xem thống kê.

***

## Bảng trong danh sách CS Tri thức

| Cột          | Mô tả                                                                          |
| ------------ | ------------------------------------------------------------------------------ |
| Ảnh đại diện | Hình thu nhỏ của CS Tri thức                                                   |
| Tên          | Tên CS Tri thức                                                                |
| Loại         | **Tài liệu** / **Toàn hệ thống** / **Theo khóa học** / **Công khai**           |
| Trạng thái   | **Đang khởi tạo** / **Đang hoạt động** / **Lỗi** (kèm lý do lỗi màu đỏ nếu có) |
| Trợ lý       | Danh sách Trợ lý AI đang sử dụng CS Tri thức này                               |
| Tạo lúc      | Thời gian tạo                                                                  |
| Hành động    | Cài đặt, Xóa                                                                   |

***

## Quyền truy cập

| Quyền                            | Mô tả                                   |
| -------------------------------- | --------------------------------------- |
| **Xem danh sách Knowledge Base** | Xem danh sách CS Tri thức               |
| **Tìm kiếm Knowledge Base**      | Tìm kiếm CS Tri thức                    |
| **Xem chi tiết Knowledge Base**  | Xem chi tiết một CS Tri thức            |
| **Tạo Knowledge Base**           | Tạo CS Tri thức mới                     |
| **Cập nhật Knowledge Base**      | Cập nhật CS Tri thức, thêm/xóa tài liệu |
| **Xoá Knowledge Base**           | Xóa CS Tri thức                         |

***

## Lưu ý

* **Giới hạn 30 CS Tri thức** mỗi site. Xóa CS Tri thức cũ nếu cần tạo thêm.
* **Dung lượng file tối đa 50 MB.** Nên chia nhỏ file lớn.
* **Model embedding** được hệ thống tự động chọn, không cần cấu hình thủ công.
* **Thời gian indexing** phụ thuộc vào kích thước tài liệu. Trợ lý AI chưa thể trả lời chính xác cho đến khi indexing hoàn tất.
* **Chi phí indexing** được trừ từ ví credit của site. Đảm bảo đủ credit trước khi tải lên tài liệu.
* **Một Trợ lý AI có thể sử dụng nhiều CS Tri thức** đồng thời, và một CS Tri thức có thể được nhiều Trợ lý sử dụng.

***

## Xem thêm

* [Tạo trợ lý AI](https://docs.noova.vn/tri-tue-nhan-tao/06-ai-tro-ly/tao-chatbot) -- Tạo chatbot và gán cơ sở tri thức
* [Credits](https://docs.noova.vn/tri-tue-nhan-tao/06-ai-tro-ly/credits) -- Quản lý hạn mức và ví credit
