Hướng dẫn số hóa đề thi PDF và ảnh chụp bằng AI

Hướng dẫn đầy đủ giúp giáo viên chuyển đề giấy hoặc file PDF thành dữ liệu có cấu trúc: từng câu hỏi, phương án A–D, đáp án và hình minh họa. Phù hợp đề Toán, Lý, Hóa, Văn, Anh và các môn trắc nghiệm khác trong chương trình phổ thông Việt Nam.

1. Chuẩn bị file đề trước khi số hóa

Chất lượng đầu vào quyết định độ chính xác OCR. Ưu tiên file PDF gốc từ Word (không scan lại nhiều lần). Nếu chỉ có đề giấy, chụp ảnh dưới ánh sáng đều, căn thẳng, không bị bóng hoặc mờ góc.

Mỗi lần upload nên là một đề hoàn chỉnh hoặc một phần rõ ràng (ví dụ: 40 câu trắc nghiệm một mạch). Tránh ghép nhiều đề khác môn trong cùng file — AI vẫn xử lý được nhưng bạn sẽ mất thời gian tách sau này.

2. Upload và review từng câu

Sau khi đăng nhập, vào Thư viện hoặc Dashboard để tải đề. Hệ thống dùng AI (Gemini) nhận diện cấu trúc: đề bài chung, số câu, nội dung, phương án và đáp án nếu có trong file gốc.

Bước review là bắt buộc với đề quan trọng. Mở từng câu, sửa lỗi OCR (lẫn o/0, dấu mũ Toán, dấu tiếng Việt). Với câu thiếu đáp án, bổ sung trước khi đưa vào ngân hàng hoặc tạo phòng thi — nếu không hệ thống không chấm tự động được.

3. Công thức Toán và ký hiệu khoa học

Exam Digitizer hỗ trợ hiển thị công thức qua LaTeX/KaTeX khi review. Nếu AI nhận sai phân số, căn bậc hoặc ký hiệu tích phân, bạn chỉnh trực tiếp trong ô nội dung bằng cú pháp $...$ cho công thức dòng.

Khi xuất Word, công thức được giữ dạng có thể chỉnh tiếp trong Word hoặc chuyển sang MathType tùy quy trình trường bạn. Xuất LaTeX phù hợp giáo viên soạn đề chuyên sâu hoặc in qua TeX.

4. Hình minh họa và bbox

Đề Vật lý, Hóa, Địa lý thường có đồ thị, sơ đồ mạch, bảng số liệu. AI xác định vùng hình (bounding box) và gắn ảnh cắt vào đúng câu hỏi khi xuất Word hoặc lưu ngân hàng.

Nếu hình bị gắn nhầm câu, vào bước review để điều chỉnh hoặc upload lại ảnh minh họa. Gói Premium có thêm tùy chọn chuyển hình sang TikZ vector cho đề in chất lượng cao.

5. Xuất Word, Excel và tích hợp Azota

Sau review, chọn Export để tải DOCX bám sát layout đề (tiêu đề, câu hỏi, phương án). File Excel/CSV xuất theo mẫu Azota, Google Forms hoặc định dạng chung — mỗi dòng một câu, cột đáp án riêng.

Nhiều giáo viên dùng quy trình: số hóa một lần → lưu ngân hàng → mỗi kỳ ghép 40 câu mới từ kho → trộn 4 mã đề → in hoặc giao online. Như vậy không phải gõ lại đề cũ.

6. Lỗi thường gặp và cách xử lý

Độ tin cậy thấp (confidence < 95%): thường do ảnh mờ hoặc đề viết tay. Nên chụp lại hoặc scan DPI cao hơn, sau đó chạy lại extraction.

Câu gộp nhiều ý: tách thủ công thành hai câu trong review nếu AI gộp nhầm. Đoạn văn chung (đọc hiểu): gắn passage cho các câu con để khi làm bài online học sinh thấy đủ ngữ cảnh.

7. Dùng thử không cần đăng nhập

Trang chủ có mục demo: kéo thả một ảnh đề (giới hạn dung lượng) để xem AI tách vài câu đầu. Đây là cách nhanh nhất đánh giá chất lượng với loại đề bạn hay dùng trước khi tạo tài khoản.