Tôi đã trải nghiệm Gemini 3 Pro được một thời gian và để tôi nói ngắn gọn thế này: Nó tốt hơn bản 2.5 Pro về mọi mặt! Bài viết này chia sẻ các nguyên tắc và cấu trúc câu lệnh đang hiệu quả nhất với tôi hiện tại. Đây không phải là "tiêu chuẩn vàng" duy nhất, mà là một điểm khởi đầu để giúp bạn tinh chỉnh chiến lược của riêng mình. Hãy chọn lọc những gì hiệu quả, điều chỉnh những gì chưa ổn và không ngừng cải thiện.
Các nguyên tắc cốt lõi
Gemini 3 ưu tiên sự trực diện hơn là sự thuyết phục, và ưu tiên logic hơn là sự dài dòng. Để tối ưu hóa hiệu suất, hãy tuân thủ các nguyên tắc cốt lõi sau:
- Chỉ dẫn chính xác: Hãy súc tích trong các prompt đầu vào. Gemini 3 phản hồi tốt nhất với các chỉ dẫn trực tiếp và rõ ràng. Hãy nêu mục tiêu của bạn một cách rành mạch, không rườm rà.
- Sự nhất quán & Tham số xác định: Duy trì một cấu trúc đồng nhất trong suốt các prompt (ví dụ: sử dụng các thẻ XML tiêu chuẩn hóa) và định nghĩa rõ ràng các thuật ngữ dễ gây nhầm lẫn.
- Độ chi tiết của đầu ra (Verbosity): Theo mặc định, Gemini 3 ít nói hơn và thích đưa ra các câu trả lời trực tiếp, hiệu quả. Nếu bạn cần một phong cách trò chuyện cởi mở hoặc "tâm sự" hơn, bạn phải yêu cầu điều đó một cách rõ ràng.
- Sự gắn kết đa phương thức (Multimodal Coherence): Văn bản, hình ảnh, âm thanh hoặc video nên được đối xử như các đầu vào có vai trò ngang hàng. Các chỉ dẫn nên tham chiếu rõ ràng đến từng loại dữ liệu cụ thể để đảm bảo mô hình tổng hợp thông tin xuyên suốt thay vì phân tích chúng một cách cô lập.
- Vị trí đặt các ràng buộc: Đặt các ràng buộc về hành vi và định nghĩa vai trò (role) trong phần System Instruction (Chỉ dẫn hệ thống) hoặc ở ngay đầu prompt để đảm bảo chúng đóng vai trò là "mỏ neo" cho quá trình suy luận của mô hình.
- Cấu trúc cho ngữ cảnh dài: Khi làm việc với các ngữ cảnh lớn (sách, kho mã nguồn, video dài), hãy đặt các chỉ dẫn cụ thể của bạn ở cuối prompt (sau phần dữ liệu ngữ cảnh).
- Kết nối ngữ cảnh (Context Anchoring): Khi chuyển từ một khối dữ liệu lớn sang câu hỏi của bạn, hãy tạo cầu nối rõ ràng. Sử dụng các cụm từ dẫn dắt như: "Dựa trên những thông tin phía trên..." trước khi đặt câu hỏi.
Suy luận và Lập kế hoạch (Reasoning and Planning)
Lập kế hoạch & Chia nhỏ nhiệm vụ rõ ràng
Trước khi đưa ra câu trả lời cuối cùng, hãy thực hiện:
- Phân tích: Chia mục tiêu đã nêu thành các nhiệm vụ con (sub-tasks) riêng biệt.
- Kiểm tra dữ liệu: Thông tin đầu vào đã đầy đủ chưa? Nếu chưa, hãy dừng lại và yêu cầu bổ sung.
- Tối ưu hóa: Có công cụ, lối tắt hoặc phương pháp "người dùng chuyên nghiệp" (power user) nào giải quyết vấn đề này tốt hơn cách thông thường không? (Ví dụ: "Đừng chỉ liệt kê thông số, hãy gợi ý một giải pháp thay thế").
- Lập dàn ý: Tạo một cấu trúc khung để đạt được mục tiêu.
- Xác nhận: Kiểm tra lại mức độ hiểu biết của bạn trước khi tiến hành.
Trình theo dõi TODO tự cập nhật
Tạo một danh sách TODO để theo dõi tiến độ:
- [ ] Mục tiêu chính
- [ ] Nhiệm vụ 1
- [ ] Nhiệm vụ 2
- ...
- [ ] Kiểm tra lại (Review)
Tự phê bình kết quả (Critique)
Trước khi trả về phản hồi cuối cùng, hãy đối chiếu kết quả với các ràng buộc ban đầu của người dùng:
- Tôi đã trả lời đúng ý định (intent) của người dùng chưa, hay chỉ trả lời theo nghĩa đen?
- Tông giọng có đúng với nhân vật (persona) được yêu cầu không?
- Nếu tôi có đưa ra giả định do thiếu dữ liệu, tôi đã đánh dấu rõ ràng chưa?
Viết Prompt có cấu trúc (Structured Prompting)
Sử dụng thẻ kiểu XML hoặc Markdown để cấu trúc prompt. Điều này tạo ra ranh giới rõ ràng giúp mô hình phân biệt giữa chỉ dẫn và dữ liệu. Lưu ý: Không trộn lẫn XML và Markdown, hãy chọn một định dạng để đảm bảo tính nhất quán.
Ví dụ XML:
<rules>
1. Khách quan.
2. Trích dẫn nguồn.
</rules>
<planning_process>
1. Phân tích yêu cầu: Xác định mục tiêu cốt lõi và các ràng buộc.
2. Chia nhỏ: Tách vấn đề thành các nhiệm vụ con hoặc biến số logic.
3. Chiến lược: Phác thảo phương pháp từng bước để giải quyết mỗi nhiệm vụ.
4. Xác minh: Kiểm tra kế hoạch để tìm lỗ hổng logic hoặc các trường hợp biên.
</planning_process>
<error_handling>
NẾU <context> trống, thiếu mã nguồn hoặc thiếu dữ liệu cần thiết:
KHÔNG cố gắng tạo ra giải pháp.
KHÔNG tự bịa ra dữ liệu.
Hãy đưa ra yêu cầu lịch sự để bổ sung thông tin thiếu.
</error_handling>
<context>
[Chèn đầu vào của người dùng tại đây - Mô hình hiểu đây là dữ liệu, không phải chỉ dẫn]
</context>
Ví dụ Markdown:
Danh tính
Bạn là một kiến trúc sư giải pháp cao cấp.
Ràng buộc
- Không sử dụng thư viện bên ngoài.
- Chỉ sử dụng cú pháp Python 3.11+.
Định dạng đầu ra
Chỉ trả về một khối mã nguồn duy nhất.
Sử dụng công cụ theo phong cách Agent (Agentic Tool Use)
Chỉ thị về tính kiên trì (The Persistence Directive)
Bạn là một agent tự hành:
- Tiếp tục làm việc cho đến khi truy vấn của người dùng được giải quyết HOÀN TOÀN.
- Nếu một công cụ thất bại, hãy phân tích lỗi và thử một cách tiếp cận khác.
- KHÔNG trả lại quyền kiểm soát cho người dùng cho đến khi bạn đã xác minh được giải pháp.
Suy ngẫm trước khi tính toán (Pre-Computation Reflection)
Trước khi gọi bất kỳ công cụ nào, hãy nêu rõ:
- Tại sao bạn gọi công cụ này.
- Dữ liệu cụ thể nào bạn kỳ vọng thu thập được.
- Dữ liệu này giúp giải quyết vấn đề của người dùng như thế nào.
Các trường hợp sử dụng theo lĩnh vực cụ thể
Nghiên cứu và Phân tích
- Chia nhỏ chủ đề thành các câu hỏi nghiên cứu chính.
- Tìm kiếm/Phân tích các nguồn được cung cấp cho từng câu hỏi một cách độc lập.
- Tổng hợp các phát hiện thành một báo cáo mạch lạc.
- QUY TẮC TRÍCH DẪN: Nếu bạn đưa ra một khẳng định cụ thể, bạn phải trích dẫn nguồn. Nếu không có nguồn, hãy nêu rõ đó là ước tính chung. Mọi khẳng định phải được theo sau ngay lập tức bởi một tham chiếu [ID Nguồn].
Viết lách sáng tạo
- Xác định đối tượng mục tiêu và mục tiêu cụ thể (ví dụ: tạo sự đồng cảm hay thể hiện uy quyền).
- Nếu nhiệm vụ yêu cầu sự đồng cảm hoặc gần gũi, tuyệt đối tránh thuật ngữ chuyên môn khô khan (ví dụ: "cộng hưởng", "giao thức", "đảm bảo").
- Viết bản thảo.
- Tự đọc lại bản thảo. Bản thảo này nghe giống con người hay giống một biểu mẫu? Nếu nghe như robot, hãy viết lại.
Giải quyết vấn đề
- Diễn đạt lại vấn đề theo ngôn ngữ của bạn.
- Xác định "Giải pháp tiêu chuẩn".
- Xác định "Giải pháp cho người dùng chuyên nghiệp" (Có mẹo, công cụ cụ thể hay sắc thái nào mà hầu hết mọi người bỏ lỡ không?).
- Trình bày giải pháp, ưu tiên phương pháp hiệu quả nhất ngay cả khi nó hơi khác so với định dạng người dùng yêu cầu.
- Kiểm tra thực tế: Giải pháp này có giải quyết được gốc rễ vấn đề không?
Nội dung giáo dục
- Đánh giá mức độ kiến thức hiện tại của người dùng dựa trên truy vấn của họ.
- Định nghĩa các thuật ngữ chính trước khi sử dụng chúng.
- Giải thích khái niệm bằng một phép ẩn dụ liên quan.
- Đưa ra một câu hỏi "Kiểm tra mức độ hiểu bài" ở cuối.
Mẫu Prompt ví dụ (Example Template)
Mẫu này kết hợp các thực hành tốt nhất (Cấu trúc thân thiện với bộ nhớ đệm, Lập kế hoạch và Ranh giới XML) thành một khung có thể tái sử dụng.
⚠️ Lưu ý: Tư duy kỹ thuật
Không có cấu trúc ngữ cảnh hay mẫu prompt nào là "hoàn hảo". Kỹ nghệ ngữ cảnh là một nỗ lực thực nghiệm, không phải là một cú pháp cố định. Cấu trúc tối ưu phụ thuộc nhiều vào dữ liệu cụ thể, giới hạn độ trễ và độ phức tạp của lĩnh vực. Hãy coi các mẫu dưới đây là nền tảng vững chắc, nhưng hãy sẵn sàng lặp lại, đo lường và tinh chỉnh dựa trên trường hợp sử dụng của bạn.
System Instruction (Chỉ dẫn hệ thống)
<role> Bạn là Gemini 3, một trợ lý chuyên gia về [Chèn lĩnh vực, ví dụ: Khoa học dữ liệu]. Bạn làm việc chính xác, có tính phân tích và kiên trì. </role> <instructions> 1. **Lập kế hoạch**: Phân tích nhiệm vụ và tạo kế hoạch từng bước thành các nhiệm vụ con rõ ràng. 2. **Thực thi**: Thực hiện kế hoạch. Nếu sử dụng công cụ, hãy suy ngẫm trước mỗi lần gọi. Theo dõi tiến độ trong danh sách TODO: sử dụng [ ] cho việc chưa làm, [x] cho việc đã xong. 3. **Xác minh**: Kiểm tra đầu ra so với nhiệm vụ của người dùng. 4. **Định dạng**: Trình bày câu trả lời cuối cùng theo cấu trúc được yêu cầu. </instructions> <constraints> - Độ chi tiết (Verbosity): [Thấp/Trung bình/Cao] - Tông giọng: [Trang trọng/Thân mật/Kỹ thuật] - Xử lý sự mơ hồ: CHỈ đặt câu hỏi làm rõ nếu thiếu thông tin quan trọng; nếu không, hãy đưa ra các giả định hợp lý và nêu rõ chúng. </constraints> <output_format> Cấu trúc phản hồi của bạn như sau: 1. **Kế hoạch thực hiện** (Sử dụng danh sách TODO) 2. **Tóm tắt điều hành**: [Tổng quan trong 2 câu] 3. **Phản hồi chi tiết**: [Nội dung chính] </output_format>
User Prompt (Prompt của người dùng)
<context> [Chèn tài liệu liên quan, đoạn mã nguồn hoặc thông tin nền tại đây] </context> <task> [Chèn yêu cầu cụ thể của người dùng tại đây] </task> <final_instruction> Hãy nhớ suy nghĩ từng bước trước khi trả lời. </final_instruction>
Nguồn bài viết từ Tác giả Phil Schmid