Google đã chính thức công bố tính năng Video Overviews cho NotebookLM, trợ lý ghi chú và nghiên cứu dựa trên AI, cho phép người dùng chuyển đổi tài liệu phức tạp thành các bản trình bày trực quan dễ hiểu.
Tính năng Video Overviews đã được giới thiệu lần đầu tại Google I/O vào tháng 5, cho phép người dùng biến các tài liệu đa phương tiện phức tạp như ghi chú thô, file PDF và hình ảnh thành các bản trình bày trực quan dễ tiêu hóa.
Trước đây, dịch vụ này đã sử dụng phương pháp âm thanh để giúp người dùng hiểu tài liệu thông qua Audio Overviews, một tính năng cho phép tạo ra podcast với các host ảo AI dựa trên các tài liệu mà người dùng chia sẻ với NotebookLM, chẳng hạn như tài liệu học tập hoặc hồ sơ pháp lý.
Với khả năng mới này, NotebookLM đang áp dụng cách tiếp cận trực quan hơn để giúp người dùng hiểu các chủ đề và ý tưởng khác nhau. Google cho biết người dùng có thể coi Video Overviews như một giải pháp thay thế trực quan cho Audio Overviews.
Tính năng này tạo ra các hình ảnh mới trong khi kết hợp các hình ảnh, sơ đồ, trích dẫn và số liệu từ các tài liệu đã tải lên để giải thích nội dung. Google cho biết tính năng này phù hợp để giải thích dữ liệu, minh họa quy trình và làm cho các khái niệm trừu tượng dễ hiểu hơn.
Người dùng có thể tùy chỉnh Video Overviews của mình, giống như cách họ làm với Audio Overviews. Họ có thể chỉ định các chủ đề cần tập trung, cho biết mục tiêu học tập, mô tả đối tượng mục tiêu và nhiều hơn nữa.
Người dùng có thể đặt các câu hỏi đơn giản như “Tôi không biết gì về chủ đề này; hãy giúp tôi hiểu các sơ đồ trong tài liệu”, hoặc các câu hỏi cụ thể như “Tôi đã là chuyên gia về X và nhóm của tôi làm việc về Y; hãy tập trung vào Z”.
Video Overviews hiện đang được triển khai cho tất cả người dùng bằng tiếng Anh, với việc hỗ trợ thêm nhiều ngôn ngữ khác sẽ sớm ra mắt, Google cho biết.
Google cũng thông báo rằng họ đang triển khai các bản cập nhật cho bảng điều khiển Studio của NotebookLM. Người dùng giờ đây có thể tạo và lưu trữ nhiều đầu ra studio cùng loại trong một notebook duy nhất. Ngoài ra, người dùng sẽ thấy bốn ô ở đầu bảng điều khiển Studio để tạo Audio Overviews, Video Overviews, Mind Maps và Reports chỉ với một cú nhấp chuột.
Bên cạnh đó, người dùng giờ đây có thể đa nhiệm trong bảng điều khiển Studio. Ví dụ, họ có thể nghe Audio Overview trong khi đồng thời khám phá Mind Map hoặc xem lại Study Guide.