Trong cuộc phỏng vấn với Oren Eini của RavenDB, chúng ta sẽ tìm hiểu về những ưu điểm của cơ sở dữ liệu NoSQL này so với các đối thủ cạnh tranh, cũng như trí tuệ nhân tạo (AI) dành cho nhà phát triển và quản trị viên.
Nếu các công nghệ cơ sở dữ liệu cung cấp hiệu suất, tính linh hoạt và bảo mật, hầu hết các chuyên gia sẽ hài lòng nếu có được hai trong ba yếu tố đó, và họ cũng có thể phải chấp nhận một số thỏa hiệp. Các hệ thống được tối ưu hóa cho tốc độ đòi hỏi phải tinh chỉnh thủ công, trong khi các nền tảng linh hoạt có thể gây tốn kém khi các thiết kế ban đầu trở thành những hạn chế. Bảo mật, đáng buồn thay, đôi khi chỉ là một phần bổ sung, với các quản trị viên cơ sở dữ liệu (DBA) phải dựa vào kỹ năng và kiến thức của các nhóm nội bộ để không đưa vào những thay đổi gây hỏng hóc.
RavenDB ra đời vì người sáng lập của nó đã nhìn thấy chi phí tích lũy của những sự đánh đổi phổ biến đó và những vấn đề cố hữu bắt nguồn từ chúng. Họ muốn một hệ thống cơ sở dữ liệu không bắt các nhà phát triển và quản trị viên phải lựa chọn.
Oren Eini, người sáng lập và CTO của RavenDB, từng là một chuyên gia tư vấn hiệu suất cơ sở dữ liệu tự do gần hai thập kỷ trước. Trong một cuộc phỏng vấn độc quyền, ông đã kể lại cách ông gặp nhiều nhóm có năng lực "tự đào hố chôn mình" khi các hệ thống mà họ quản lý ngày càng phức tạp. Những vấn đề ông gặp phải không bắt nguồn từ việc các nhà phát triển thiếu kỹ năng cần thiết, mà là từ kiến trúc hệ thống. Các cơ sở dữ liệu có xu hướng dẫn dắt nhà phát triển hướng tới những thiết kế mong manh và trừng phạt họ vì đi theo những con đường đó, ông nói. RavenDB là một dự án bắt đầu như một cách để giảm bớt sự ma sát khi nhu cầu không thể ngăn cản va chạm với "ngọn núi" lược đồ cơ sở dữ liệu.
Sự nhấn mạnh của nền tảng này là vào hiệu suất và khả năng thích ứng mà không cần (trớ trêu thay) đến dịch vụ của những người như Oren ở một giai đoạn nào đó. Được trang bị túi đầy kinh nghiệm và kiến thức, ông đã thành lập RavenDB, công ty hiện đã hoạt động được hơn mười lăm năm – từ rất lâu trước khi trào lưu phát triển được hỗ trợ bởi AI như hiện nay bùng nổ.
Điểm mấu chốt là theo thời gian, cơ sở dữ liệu RavenDB sẽ thích ứng với những gì tổ chức quan tâm, thay vì những gì nó dự đoán có thể quan tâm khi cơ sở dữ liệu lần đầu tiên được khởi tạo. "Khi tôi nói chuyện với những người làm kinh doanh," Eini nói, "tôi nói với họ rằng tôi sẽ giải quyết sự phức tạp của quyền sở hữu dữ liệu."
Ví dụ, thay vì kỳ vọng các nhà phát triển hoặc DBA dự đoán mọi mẫu truy vấn có thể xảy ra, RavenDB quan sát các truy vấn khi chúng được thực thi. Nếu phát hiện ra rằng một truy vấn sẽ có lợi từ một chỉ mục (index), nó sẽ tạo ra một chỉ mục trong nền với chi phí vận hành tối thiểu cho quá trình xử lý hiện có. Điều này trái ngược với hầu hết các cơ sở dữ liệu quan hệ, nơi mà lược đồ và chiến lược lập chỉ mục được thiết lập bởi các nhà phát triển ban đầu, nên rất khó thay đổi sau này, bất kể tổ chức đó có thể đã thay đổi như thế nào.
Oren đưa ra so sánh với việc đổ móng của một tòa nhà trước khi quyết định vị trí của cửa ra vào và các cột trụ. Đó là một cách tiếp cận có thể hoạt động, nhưng khi doanh nghiệp thay đổi hướng đi sau nhiều năm, chi phí để hối hận về những quyết định ban đầu đó có thể rất đáng báo động.
Phát biểu trước thềm sự kiện TechEx Global sắp tới tại London năm nay (ngày 4 và 5 tháng 2, Olympia), ông đã trích dẫn một ví dụ về một khách hàng châu Âu gặp khó khăn khi mở rộng sang thị trường Mỹ vì cơ sở dữ liệu của họ giả định một mức thuế suất VAT đơn giản mà họ đã đưa vào một trường duy nhất, một lược đồ không phù hợp với sự phức tạp của thuế bán hàng tiểu bang và liên bang. Từ những quyết định có vẻ đơn giản trong quá khứ (và có lẽ không được cân nhắc nhiều – thuế VAT châu Âu khá chuẩn mực), khách hàng này đã tích trữ gánh nặng tài chính và nợ kỹ thuật cho thế hệ sau.
Phần lớn sức hấp dẫn của RavenDB nằm ở các chi tiết thực tế và những tinh chỉnh nhỏ giúp cơ sở dữ liệu hoạt động hiệu quả hơn và dễ dàng tiếp cận hơn. Ví dụ, phân trang yêu cầu hai lần gọi cơ sở dữ liệu trong hầu hết các hệ thống (một để lấy một trang kết quả, một để đếm các bản ghi khớp). RavenDB trả về cả hai trong một truy vấn duy nhất. Riêng lẻ, những tối ưu hóa như vậy có vẻ nhỏ nhặt, nhưng ở quy mô lớn chúng sẽ cộng hưởng lại. Oren nói: "Nếu bạn làm mịn sự ma sát ở mọi nơi bạn đi qua, bạn sẽ có một hệ thống thực sự tốt mà không cần phải đối mặt với ma sát."
Việc loại bỏ ma sát một cách tổng hợp giúp cải thiện hiệu suất và làm cho công việc của các nhà phát triển trở nên đơn giản hơn. Dữ liệu liên quan được nhúng hoặc bao gồm mà không chịu các hình phạt liên quan đến việc liên kết bảng (join) trong cơ sở dữ liệu quan hệ, vì vậy các truy vấn phức tạp được hoàn thành trong một vòng phản hồi duy nhất. Các kỹ sư phần mềm không cần phải là chuyên gia cơ sở dữ liệu. Trong thế giới của họ, họ chỉ cần tạo các truy vấn giống như SQL cho các API của RavenDB.
So với các cơ sở dữ liệu NoSQL khác, RavenDB cung cấp đầy đủ các giao dịch ACID theo mặc định và giảm bớt sự phức tạp trong vận hành: nhiều tính năng tích hợp sẵn của nó (đường ống ETL, đăng ký, tìm kiếm toàn văn, bộ đếm, chuỗi thời gian, v.v.) làm giảm nhu cầu về các hệ thống bên ngoài.
Ngược lại với các DBA và nhà phát triển phần mềm đang giải quyết một hệ thống cơ sở dữ liệu cạnh tranh và các phụ trợ cần thiết của nó, cả nhà phát triển và quản trị viên đều dành ít thời gian hơn để lo lắng về chi tiết với RavenDB. Đó là tin tốt, nhất là đối với những người nắm giữ ngân sách của tổ chức.
RavenDB cũng được xây dựng để mở rộng quy mô một cách dễ dàng như cách nó xử lý các truy vấn phức tạp. Nó có thể tạo ra các cụm (cluster) đa nút nếu muốn để hỗ trợ số lượng lớn người dùng đồng thời. Các cụm như vậy được RavenDB tạo ra mà không cần cấu hình thủ công tốn thời gian. "Với RavenDB, đây là chi phí kinh doanh bình thường," ông nói.
Vào tháng 2 năm nay, RavenDB Cloud đã công bố phiên bản 7.2, và vì đây là năm 2026, nên cần phải nhắc đến AI. Trợ lý AI của RavenDB "thực tế, [...] là một DBA ảo đi kèm bên trong cơ sở dữ liệu của bạn," ông nói. Từ khóa ở đây là bên trong. Nó được thiết kế cho các nhà phát triển và quản trị viên, không phải người dùng cuối, nhằm trả lời các câu hỏi của họ về lập chỉ mục, sử dụng bộ nhớ hoặc hành vi của hệ thống.
Ông hoài nghi về việc cho phép AI truy cập không giới hạn vào bất kỳ kho lưu trữ dữ liệu nào. Cho phép một AI hoạt động như một người gác cổng chung cho thông tin nhạy cảm sẽ tạo ra những rủi ro bảo mật khó tránh khỏi, vì những hệ thống như vậy rất khó để ràng buộc một cách đáng tin cậy.
Đối với DBA và nhà phát triển phần mềm, đó lại là một câu chuyện khác – AI là một công cụ hữu ích hoạt động như một trợ thủ, cấu hình và xử lý dữ liệu. Trợ lý AI của RavenDB kế thừa các quyền của người dùng gọi nó, bản thân nó không có quyền truy cập đặc quyền nào. "Bất cứ điều gì nó biết về phiên bản RavenDB của bạn đều có được bởi vì, đằng sau hậu trường, nó đang truy cập vào hệ thống của bạn với các quyền hạn của chính bạn," ông nói.
Chiến lược AI của công ty là cung cấp cho các nhà phát triển và quản trị viên các tính năng có tính định hướng: tạo truy vấn, giải thích các chỉ mục, giúp khám phá lược đồ và trả lời các câu hỏi vận hành, với các lệnh gọi được ràng buộc bởi xác thực và đặc quyền của người vận hành.
Các nhóm phát triển ứng dụng với RavenDB nhận được sự hỗ trợ cho tìm kiếm vector, nhúng (embeddings) gốc, lập chỉ mục phía máy chủ và tích hợp không phụ thuộc vào nền tảng với các LLM bên ngoài. Điều này, Oren nói, cho phép các tổ chức cung cấp các tính năng hữu ích dựa trên AI trong các ứng dụng của họ một cách nhanh chóng mà không để doanh nghiệp gặp rủi ro và các vấn đề tuân thủ.
Bảo mật và rủi ro là một trong những lĩnh vực mà RavenDB vạch ra ranh giới rõ ràng giữa mình và các đối thủ cạnh tranh. Chúng tôi đã đề cập đến lỗ hổng MongoBleed gần đây, lỗ hổng này đã làm rò rỉ dữ liệu từ các phiên bản MongoDB không được xác thực do sự tương tác giữa mã nén và mã xác thực. Oren mô tả vấn đề này là một thất bại về mặt kiến trúc do trộn lẫn các đường dẫn mã mục đích chung và mã quan trọng về bảo mật. "Lý do đây là một lỗ hổng," ông nói, "cụ thể là do thực tế bạn đang cố gắng trộn lẫn các mối quan tâm khác nhau."
RavenDB sử dụng hạ tầng mật mã đã được thiết lập để xử lý xác thực trước khi bất kỳ logic cơ sở dữ liệu nào được gọi. Và ngay cả khi một lỗ hổng bắt nguồn từ nơi khác, bề mặt tấn công sẽ nhỏ hơn đáng kể vì những người dùng không được xác thực không bao giờ chạm tới các đường dẫn mã chung: sự tách biệt về kiến trúc đó giới hạn phạm vi ảnh hưởng.
Trong khi các cấu tạo bên trong của RavenDB mang tính kỹ thuật cao và chuyên sâu, các nhà ra quyết định kinh doanh có thể dễ dàng nhận thấy rằng sự chậm trễ do thay đổi lược đồ, tinh chỉnh hiệu suất hoặc thay đổi hạ tầng sẽ có tác động kinh tế đáng kể. Nhưng tính linh hoạt và tốc độ của RavenDB cũng loại bỏ những gì Oren mô tả là các cuộc hội thoại kiểu "không, bạn không thể làm điều đó".
Các tổ chức chạy RavenDB giảm bớt sự phụ thuộc vào chuyên môn chuyên biệt, đồng thời họ có khả năng đáp ứng các nhu cầu kinh doanh đang thay đổi nhanh hơn nhiều. "Vai trò của [cơ sở dữ liệu] là mang lại giá trị kinh doanh thực sự," Eini nói, cho rằng hạ tầng nên mờ nhạt dần vào hậu trường trong các bối cảnh vận hành. Hiện tại, nó thường quyết định phạm vi của các cuộc thảo luận chiến lược.
RavenDB sử dụng ngôn ngữ truy vấn giống như SQL quen thuộc và hầu hết các nhóm sẽ chỉ cần tối đa một ngày để bắt kịp tốc độ. Oren gợi ý rằng, nơi nào xuất hiện sự ma sát, thường là do những giả định được mang sang từ các nền tảng khác về tính bảo mật và tính sẵn sàng cao. Đối với RavenDB, những điều này đã được tích hợp sẵn trong thiết kế nên không gây thêm khối lượng công việc cần phải tính đến.
Ra đời từ kết quả của trải nghiệm về nỗi đau vận hành của chính người sáng lập công ty, sự khác biệt của RavenDB bắt nguồn từ các quyết định thiết kế tích lũy: lập chỉ mục nền, tối ưu hóa nhận biết truy vấn, tách biệt các vấn đề bảo mật và xác thực, và gần đây là nhu cầu về các ràng buộc trên các công cụ AI. Trong quá trình sử dụng hàng ngày, các nhà phát triển gặp ít khó khăn hơn, và về lâu dài, các nhà lãnh đạo doanh nghiệp thấy được sự cắt giảm chi phí, đặc biệt là vào những thời điểm thay đổi. Sự kết hợp này đủ thuyết phục để thay thế các nền tảng đã ăn sâu trong nhiều bối cảnh.
Để tìm hiểu thêm, bạn có thể nói chuyện với các đại diện của RavenDB tại TechEx Global, được tổ chức tại Olympia, London, vào ngày 4 và 5 tháng 2. Nếu những gì bạn đọc ở đây đánh thức sự quan tâm của bạn, hãy truy cập trang web của công ty.