Với mục tiêu trở thành Trung tâm dữ liệu thông minh nhất thuộc loại này, Trung tâm dữ liệu Oraichain dần dần được trang bị các chức năng hỗ trợ bởi AI để nâng cao quy trình ghi nhãn và kiểm soát chất lượng dữ liệu. Bài viết này giới thiệu công cụ tự động gắn nhãn với một số mô hình AI gần đây đã được thêm vào Trung tâm dữ liệu Oraichain.
Quy mô thị trường ghi nhãn và thu thập dữ liệu toàn cầu được định giá là 2,6 tỷ USD vào năm 2021 và được dự đoán sẽ thể hiện tốc độ CAGR là 27,7% trong giai đoạn dự báo (2021–2030). Những người chơi chính là Amazon Inc., Appen Limited, Reality AI, Summa Linguae Technologies, Global Technology Solutions, Alegion, Labelbox, Inc., Dobility, Inc., Scale AI, Inc., Dataloop Ltd., Playment Inc. và Falkonry.
Nguồn: GlobeNewswire – Quince Market Insights
Tính năng này được xây dựng dựa trên nền tảng cơ bản của công nghệ Blockchain, Trung tâm dữ liệu Oraichain đi một nhánh khác với các đối thủ cạnh tranh trong ngành AI truyền thống. Trung tâm dữ liệu Oraichain sẽ sử dụng sức mạnh của nguồn cung ứng từ đám đông theo cách phi tập trung hơn, tích hợp cơ chế DeFi trong một số quy trình và trên hết, áp dụng AI cho nhiều phần quan trọng của Thị trường dữ liệu: Ghi nhãn, Đánh giá, Trao đổi và Kiểm soát tiền bản quyền. Với mục tiêu cuối cùng, Trung tâm dữ liệu Oraichain sẽ cung cấp nguồn dữ liệu vô hạn và đáng tin cậy cho không chỉ các dịch vụ của Oracle cho các blockchain mà còn cho ngành đào tạo AI.
Trong phần thảo luận ở bài viết này, chúng tôi sẽ giới thiệu việc tích hợp để tự động gắn nhãn trên Trung tâm dữ liệu Oraichain. Đối với Giao thức tiền bản quyền, bạn có thể xem bài viết giới thiệu của chúng tôi. Chúng tôi sẽ đề cập đến AI để xem xét và trao đổi bộ dữ liệu trên Thị trường (cũng như cơ chế đặt cược) trong các bài viết trong tương lai.
Ghi nhãn dữ liệu là một nhiệm vụ quan trọng nhưng nó cũng là một công việc tẻ nhạt. Việc duyệt qua hàng trăm hoặc hàng nghìn mẫu dữ liệu để chú thích từng mẫu cho một nhiệm vụ tương ứng có thể dẫn đến sự nhàm chán và do đó, gây ra việc gắn nhãn không nhất quán, chú thích ngẫu nhiên hoặc thậm chí là chú thích hoàn toàn sai. Điều đó sau này có thể gây hại cho quá trình đào tạo AI, vốn không bao giờ có thể trả lại các mẫu trung thực từ dữ liệu không sạch. Nếu dữ liệu được sử dụng cho các dịch vụ Oracle trên blockchain, thiệt hại có thể rất lớn trong một số trường hợp. (Đánh giá dữ liệu và kiểm soát chất lượng sẽ được thảo luận trong các bài viết sau.)
Đồng thời, nó cũng hỗ trợ người chú thích cho nhiệm vụ quan trọng nhưng dễ xảy ra lỗi này, Trung tâm dữ liệu Oraichain phát triển một giao diện trừu tượng để đối với mỗi tập dữ liệu yêu cầu, một công cụ trợ lý dựa trên AI (Nút nhãn tự động trên giao diện) có thể được tích hợp và giúp người chú thích dữ liệu nhãn hiệu quả và hiệu quả hơn. Thay vì chú thích mọi thứ từ đầu (như pixel này đến pixel khác hoặc mọi hộp giới hạn), người chú thích có thể điều chỉnh chú thích để làm cho nó rõ ràng và chính xác hơn.
Video (Tự động gắn nhãn trên Trung tâm dữ liệu Oraichain)
https://www.youtube.com/watch?v=pFmqgdyoU3Y&t=37s
Để tạo điều kiện cho bạn tưởng tượng về chức năng này, hãy cùng xem qua một số mô hình tự động gắn nhãn dựa trên AI trên Trung tâm dữ liệu Oraichain:
- Phân đoạn phiên bản với mặt nạ
- Phân đoạn phiên bản với đa giác
- Nhận dạng ký tự quang học (OCR)
- Trả lời câu hỏi trực quan
- Chú thích hình ảnh
Phân đoạn phiên bản với mặt nạ
Phân đoạn đối tượng là một phương pháp xác định, đối với mỗi pixel, một thể hiện thuộc về đối tượng. Nó phát hiện từng đối tượng quan tâm khác nhau trong hình ảnh. Ví dụ, khi mỗi người trong một hình được phân đoạn thành một đối tượng riêng lẻ. Phân đoạn đối tượng với Mặt nạ gán nhãn cho từng pixel của đối tượng, giống như cách các đối tượng này được sơn tốt với các màu khác nhau.
Phân đoạn phiên bản với mặt nạ
Phân đoạn phiên bản với đa giác
Một kiểu Phân đoạn Phiên bản khác, nhưng mô hình này giúp xác định các đối tượng có đa giác.
Phân đoạn phiên bản với đa giác
Nhận dạng ký tự quang học (OCR)
Đây chính là các mô hình OCR là để phân biệt các ký tự văn bản in hoặc viết tay bên trong hình ảnh kỹ thuật số của tài liệu vật lý, chẳng hạn như tài liệu giấy được quét.
Nhận dạng ký tự quang học (OCR)
Trả lời câu hỏi bằng hình ảnh
Mô hình Trả lời câu hỏi bằng hình ảnh (VQA) là mô hình giúp đưa ra câu trả lời nhất định cho các câu hỏi được đưa ra trong nội dung trực quan như hình ảnh, video, v.v. Mặc dù dường như là một nhiệm vụ dễ dàng đối với con người, nhưng VQA đặt ra một số thách thức đối với các hệ thống AI trong các lĩnh vực xử lý ngôn ngữ tự nhiên, thị giác máy tính, xử lý âm thanh, biểu diễn tri thức và lập luận.
Chú thích hình ảnh
Phụ đề hình ảnh đề cập đến quá trình tạo mô tả văn bản từ một hình ảnh – dựa trên các đối tượng và hành động trong hình ảnh.
Đối với Oraichain Mainnet 2.0, sẽ có nhiều cập nhật công nghệ lớn về cách chúng tôi đang kết nối giữa AI và công nghệ Blockchain và biến Oraichain trở thành AI Lớp 1 đầu tiên trên thế giới, hãy chú ý theo dõi!
l l l
VỀ ORAICHAIN
Oraichain là nhà tiên tri và hệ sinh thái được hỗ trợ bởi AI đầu tiên trên thế giới dành cho blockchain. Nền tảng oracle dữ liệu Oraichain tổng hợp và kết nối các API Trí tuệ nhân tạo với các hợp đồng thông minh và các ứng dụng thông thường. Được thành lập bởi Tiến sĩ Chung Dao, sứ mệnh của Oraichain là trở thành cổng kết nối giữa AI và công nghệ blockchain, đóng vai trò là lớp nền tảng để tạo ra thế hệ hợp đồng thông minh mới và Dapps tận dụng AI.
Không giống như các oracles thông thường sử dụng dữ liệu thô, Oraichain’s AI oracle sử dụng duy nhất các API AI để xử lý và tạo dữ liệu nhanh chóng thông qua các máy ảo trên các hợp đồng thông minh. Chất lượng dữ liệu, độ tin cậy và bảo mật được nâng cao bằng cách sử dụng các trường hợp thử nghiệm, giúp tránh trung gian, tăng độ tin cậy và mở ra các chức năng ứng dụng chưa từng có.
Ngoài các kỳ tích dữ liệu, Oraichain còn kết nối các công nghệ Trí tuệ nhân tạo và Blockchain. Với AI là nền tảng, hệ sinh thái Oraichain chứa thị trường AI, Trung tâm dữ liệu & yêu cầu, Dịch vụ nhà xuất bản, Dịch vụ đào tạo và Dapp Hosting.
Mạng Oraichain cung cấp cơ sở hạ tầng và cơ chế đồng thuận cho đào tạo Blockchain và AI. Các hệ sinh thái được kết nối với nhau này đẩy nhanh sự phát triển của Web3, DeFi, các ứng dụng doanh nghiệp và học thuật. yAI.finance là trường hợp sử dụng đầu tiên của Oraichain, một nền tảng DeFi sử dụng các tính năng và chiến lược độc đáo dựa trên AI. Oraichain AI Marketplace cung cấp các sản phẩm và API AI với mục tiêu trở thành điểm tổng hợp cho các dịch vụ Trí tuệ nhân tạo.
Website | Whitepaper | Twitter | GitHub | Telegram | Facebook | LinkedIn | Youtube | Medium | Media kit
Đường link: https://blog.orai.io/integrating-auto-labeling-to-data-hub-2b2908c44faa