Chia sẻ tài liệu Microsoft Cognitive Services

Thảo luận trong 'Chuyện trò' bắt đầu bởi thuydo2211, 16 Tháng năm 2019.

  1. thuydo2211 Thành Viên Mới

    Theo thống kê, hơn 90% các công ty nằm trong danh sách Fortune 500 đang khai thác Microsoft Azure. Nay mình lụm được 1 bài tổng hợp BẰNG TIẾNG VIỆT khá chi tiết và đầy đủ về Microsoft Cognitive Services, mạn phép chia sẻ cho anh em lập trình nào có nhu cầu nha:

    Ứng dụng hiện đại có xu hướng tăng cường các tính năng thông minh sử dụng các thuật toán phức tạp hay tích hợp các công nghệ tân tiến như trí tuệ nhân tạo vào trong ứng dụng, giúp tăng trải nghiệm của người sử dụng bằng khả năng giải quyết các vấn đề của người dùng một cách thông minh và linh hoạt hơn. Tuy nhiên việc viết ra các thuật toán phức tạp không phải là chuyện một sớm một chiều và không phải lập trình viên nào cũng có thể làm được. Vậy với những lập trình viên không có khả năng làm những việc như vậy, họ sẽ cam chịu chấp nhận bị bỏ xa với xu hướng trên ư?

    Câu trả lời là KHÔNG! Trong bài viết hôm nay mình sẽ giới thiệu với các bạn một dịch vụ rất thú vị của Microsoft, giúp thu hẹp khoảng cách giữa các lập trình viên trong việc tích hợp các công nghệ tân tiến như trí tuệ nhân tạo vào trong ứng dụng. Dịch vụ mà mình muốn nói tới có tên Microsoft Cognitive Services. Với Cognitive Services của Microsoft, cho phép lập trình viên có thể tích hợp các thuật toán thông minh, sử dụng sức mạnh của machine learning vào ngay trong ứng dụng chỉ với vài dòng code. Vậy Microsoft Cognitive Services là gì?

    Microsoft Cognitive Services là gì?

    Chia sẻ tài liệu Microsoft Cognitive Services - 263562

    Microsoft Cognitive Services bao gồm một bộ các API ứng dụng trí tuệ nhân tạo thông minh, cho phép lập trình viên ở mọi cấp độ từ những bạn sinh viên viết ứng dụng đầu tiên của mình hay những lập trình viên chuyên nghiệp làm việc cho những công ty, tổ chức lớn đều có thể tạo ra được những ứng thông minh hơn một cách dễ dàng.

    Các API của Cognitive Services được viết dưới dạng REST API do vậy lập trình viên có thể tích hợp các API này trên nhiều nền tảng khác nhau như iOS, Android, hay Windows, chỉ cần có kết nối Internet.

    Tính đến thời điểm viết bài viết này, Microsoft Cognitive Services bao gồm 21 API được chia thành 5 nhóm: Vision, Speech, Language, Knowledge và Search. Hãy cùng tìm hiểu 5 nhóm API này là gì?

    Chia sẻ tài liệu Microsoft Cognitive Services - 263563

    Vision API
    Là nhóm API liên quan đến xử lý hình ảnh, trong nhóm Vision API này hiện Microsoft cung cấp 4 API sau:

    Computer Vision API: API này cho phép trích xuất những thông tin có giá trị từ bức ảnh của bạn với khả năng xác định được kiểu đối tượng trong ảnh (là bánh mỳ, con chó, con mèo hay cây cối, …) hay nếu là người thì API này cũng xác định được giới tính của nhân vật trong ảnh. Ngoài ra, API này cũng hỗ trợ nhận diện được những nhận vật nổi tiếng hay trích xuất chữ có trong bức hình của bạn.

    Face API: Cái tên nói lên tất cả, đây là API cho phép phát hiện khuôn mặt có trong bức hình của bạn. Ngoài ra, API này cũng trả về các thuộc tính của khuôn mặt như tuổi, giới tính, độ rạng ngời của nụ cười hay thậm chí là chiều dài của tóc, … Ngoài phát hiện khuôn mặt, Face API còn cho phép so sánh 2 khuôn mặt có phải là của cùng một người hay không.

    Emotion API: API này cho phép xác định tâm trạng của người có trong bức hình xem họ đang vui, đang buồn hay đang giận dữ.

    Video API: API này là một tập hợp các thuật toán xử lý video tân tiến của Microsoft. Với Video API, các nhà phát triển có thể tích hợp các tính năng chỉnh sửa video bao gồm chống rung, phát hiện khuôn mặt người, phát hiện chuyển động hay tạo video thumbnail.

    Speech API
    Là nhóm API liên quan đến xử lý âm thanh với công nghệ xử lý đến từ Bing. Trong nhóm Speech API này hiện Microsoft cung cấp 3 API:

    Bing Speech API: API này cho phép trích xuất một tập tin âm thanh sang dạng chữ, chuyển đổi định dạng chữ sang âm thanh (tức là đọc chữ) hay đoán ý của một câu nói.

    Custom Recognition Intelligent Service (CRIS): CRIS cho phép bạn có thể tùy biến language model và acoustic model sao cho phù hợp với ứng dụng hoặc người dùng của bạn.

    Speaker Recognition API: Với những thuật toán nhận dạng giọng nói tân tiến của Microsoft, API này cho phép nhận dạng giọng nói của người nói trong một tập tin âm thanh. API này bao gồm 2 thành phần: speaker verification và speaker identification tạm dịch tương ứng là xác nhận người nói và xác định người nói. Speaker Verification cho phép xác nhận và xác thực người dùng bằng giọng nói của họ. Lập trình viên chỉ cần cho người dùng đọc một đoạn văn bản có sẵn để lưu lại dữ liệu giọng nói của họ (enrollment) rồi ở mỗi lần cần xác thực, người dùng chỉ cần đọc lại chính xác đoạn văn bản đã được dùng để lấy dữ liệu giọng nói của mình (bước enrollment) để xác thực. Speaker Identification có thể xác định được người đang nói trong một tập tin âm thanh dựa trên một tập dữ liệu các người nói tiềm năng. Tính năng này cũng có thể được sử dụng để xác thực người dùng bằng giọng nói. Tuy nhiên thay vì phải đọc chính xác một đoạn văn bản cố định như Speaker Verification thì khi sử dụng tính năng Speaker Identification này, người dùng có thể đọc một đoạn văn bản bất kỳ, API sẽ phân tích và đối chiếu với tập dữ liệu giọng nói của người dùng để so sánh và xác thực.

    Language API
    Là nhóm API liên quan đến xử lý ngôn ngữ. Nhóm Language API này hiện được Microsoft cung cấp 5 API:

    Bing Spell Check API: API này cho phép phát hiện và sửa các lỗi chính tả có trong một đoạn văn bản mà bạn cung cấp. API còn có khả năng phát hiện từ lóng, sửa lỗi tên riêng hay sửa các từ đồng âm, …

    Web Language Model API: API này giúp hỗ trợ xử lý ngôn ngữ tự nhiên, với khả năng chèn khoảng cách vào 1 đoạn văn bản được viết liền nhau như hashtag hay đường dẫn.

    Linguistic Analysis API: The Linguistic Analysis API giúp bạn hiểu sâu hơn văn bản của mình. API này sẽ giúp phân tích cú pháp của ngôn ngữ tự nhiên để dễ dàng xác định được các thực thể (danh từ) hay các hành động (động từ) có trong văn bản. Việc xử lý văn bản này có thể hữu ích cho các công việc phân tích như phân tích tâm lý.

    Language Understanding Intelligent Service (LUIS): LUIS cho phép lập trình viên xây dựng các model hiểu được ngôn ngữ tự nhiên cũng như hiểu được các câu lệnh riêng được thiết kế riêng cho ứng dụng của bạn. Ví dụ: Bạn có thể nói “bật đèn trong phòng ngủ”, gửi câu lệnh đó tới LUIS model, và thay vì trả lại chính xác các câu từ có trong câu lệnh trên, LUIS sẽ trả về dữ liệu chứa: thông tin hành động là “bật” vị trí là “phòng ngủ” và đối tượng hướng đến là “bóng đèn”, từ đó ứng dụng có thể dễ dàng xử lý được câu lệnh của bạn.

    Text Analytics API: API này giúp xác định các ẩn ý, từ khóa, chủ đề hay ngôn ngữ được sử dụng có trong một đoạn văn bản.

    Knowledge API
    Là nhóm API liên quan đến tri thức. Nhóm Knowledge API này hiện bao gồm 4 API:

    Academic Knowledge API: API này cho phép lập trình viên xây dựng những giải pháp tìm kiếm tài liệu học thuật với tính năng Interpret, trả về kết quả gợi ý cho từ khóa mà người dùng nhập vào dựa vào nguồn dữ liệu phong phú từ hệ thống Microsoft Academic Graph (MAG).

    Knowledge Exploration Service API: API này cho phép lập trình viên xây dựng những giải pháp tìm kiếm sử dụng ngôn ngữ tự nhiên bằng cách dịch ngôn ngữ tự nhiên mà người dùng nhập vào sang các biểu thức truy vấn có cấu trúc mà máy tính có thể dễ dàng hiểu và xử lý được.

    Entity Linking Intelligence Service API: Với một đoạn văn bản, Entity Linking Intelligence Service sẽ nhận dạng và xác định từng thực thể (entity) có trong đoạn văn dựa vào ngữ cảnh của đoạn văn đó và sẽ liên kết những entity này tới Wikipedia. Lấy ví dụ rằng bạn có một đoạn văn bản trong đó chứa từ cloud, từ cloud này có thể hiểu sang thành “Cloud Computing” (điện toán đám mây) hay “Cloud” (đám mây trên trời), dựa vào ngữ cảnh mà API này sẽ xác định được rằng từ cloud có ý nghĩa như thế nào.

    Recommendations API: API này cho phép xây dựng các giải pháp khuyến nghị cho người dùng. Chẳng hạn như bạn xây dựng một ứng dụng bán hàng, sử dụng API này cho phép bạn dễ dàng xây dựng ra các tính năng khuyến nghị mua hàng như “Các sản phẩm được bán chạy”, “Các sản phẩm được mua cùng” hay “Những sản phẩm hàng đầu trong mặt hàng Đồ gia dụng” chẳng hạn, từ đó sẽ khuyến khích người dùng mua nhiều hơn.

    Search API
    Search API cũng cấp các giải pháp tìm kiếm sử dụng sức mạnh của Bing.com cũng như từ nhiều đối tác như AOL, Apple, Amazon, Yahoo, …. Nhóm Search API bao gồm 5 API cho các tác vụ tìm kiếm trang web, hình ảnh, video hay tin tức.

    Bing Web Search API: Đây là API chủ lực của gói Search API. Chỉ với một cú pháp lệnh gọi đến API này, lập trình viên có thể lấy được các kết quả trả về cho trang web, hình ảnh, video hay tin tức tương ứng. Nó khá tương tự với việc bạn tìm kiếm trên các công cụ tìm kiếm như Bing.com hay Google.com. Ngoài ra, lập trình viên cũng sẽ nhận được những tính năng mạnh mẽ từ công cụ tìm kiếm Bing Search như ranking kết quả tìm kiếm, phân loại kết quả tìm kiếm theo vùng, …

    Bing Autosuggest API: API này cho phép lập trình viên có thể xây dựng tính năng đề xuất các từ khóa tìm kiếm liên quan kể cả khi từ khóa tìm kiếm chưa được điền đầy đủ. Ví dụ nếu người dùng gõ từ khóa tìm kiếm là “Thời tiết tại H”, API sẽ trả về danh sách các từ khóa gợi ý như “Thời tiết tại Hà Nội”, “Thời tiết tại Hồ Chí Minh” hay “Thời tiết tại Hà Giang” chẳng hạn.

    Bing Image Search API: API này cho phép lập trình viên có thể tìm kiếm các hình ảnh tương ứng với từ khóa nhập vào. Ngoài trả về đường dẫn của hình ảnh, API này cũng trả về các metadata hữu ích như kích thước ảnh, màu chủ đạo của ảnh, …

    Bing Video Search API: API này cho phép lập trình viên có thể tìm kiếm các video tương ứng với từ khóa nhập vào. Ngoài trả về đường dẫn của video, API này cũng trả về các metadata hữu ích khác như tên nhà sản xuất, định dạng mã hóa, ảnh thumbnail, …

    Bing News Search API: API này cho phép lập trình viên có thể tìm kiếm các tin tức, bài báo tương ứng với từ khóa nhập vào. Ngoài ra, API cũng trả về các metadata hữu ích khác như thể loại, thông tin nhà xuất bản, ngày xuất bản, …

    Có thể thấy với bộ 21 API mà dịch vụ Microsoft Cognitive Services cung cấp, lập trình viên có thể thỏa sức xây dựng các ứng dụng tích hợp các tính năng thông minh sử dụng sức mạnh từ machine learning mà dịch vụ này mang lại một cách dễ dàng chỉ bằng việc gọi API và xử lý kết quả trả về với định dạng JSON.

    Hiện tại, hầu hết các API từ Cognitive Services đều có gói sử dụng miễn phí, do vậy bạn có thể ngay lập tức đăng ký và trải nghiệm ngay 21 API mà Microsoft Cognitive Services mang lại hoàn toàn miễn phí.

    Để có cái nhìn rõ hơn, trực quan hơn về những gì mà các API của Cognitive Services mang lại, Microsoft đã xây dựng cho chúng ta một ứng dụng demo chạy trên Windows 10 tích hợp một số API trong Cognitive Services có tên là Intelligent Kiosk, bạn có thể tải về để trải nghiệm ứng dụng này tại đường dẫn sau: https://aka.ms/kioskapp.

    Ngoài ra, bạn cũng có thể tham khảo các demo trực quan & có tính tương tác của các API trong Cognitive Services tại các đường dẫn sau:

    Vision
    • Computer Vision
    • Emotion
    • Face
    • Video
    Speech
    • Bing Speech
    • Custom Recognition
    • Speaker Recognition
    Language
    • Bing Spell Check
    • Language Understanding
    • Linguistic Analysis
    • Text Analytics
    • WebLM
    Knowledge
    • Academic
    • Entity Linking
    • Knowledge Exploration
    • Recommendations
    Search
    • Bing Web Search
    • Bing Image Search
    • Bing Video Search
    • Bing News Search
    • Bing Autosuggest
    Nguồn: Lion Pham Blog
    Chủ đề tương tự
  2. hoangtoncom

    hoangtoncom Thành Viên Mới

    Cảm ơn bạn đã chia sẻ, tài liệu rất hay ạ.
    Ngày 28/5 tới đây, có sự kiện Microsoft Innovation Summit 2019 với nội dung trọng tâm xoay quanh AI và machine learning, cũng như cách để áp dụng công nghệ cloud và AI cho các doanh nghiệp với yêu cầu chuyển đổi số (digital transformation). Ngoài việc nghe các diễn giải nói về AI và cách áp dụng cho doanh nghiệp, anh em còn có thể tham dự các buổi nói chuyển nhỏ vào buổi chiều dành cho lập trình viên, bạn có thể lựa đúng chủ đề quan tâm
  3. thuydo2211

    thuydo2211 Thành Viên Mới

    Ngon rồi, nếu có thời gian thì rất nên đi nghe. Năm ngoái mình cũng đi hội thảo Azure Summit 2018 với chủ đề chính là AI và công nghệ điện toán đám mây xoay quanh hệ sinh thái Azure. Nói chung là bổ não lắm.
  4. chuppachupp

    chuppachupp Thành Viên Mới

    Có thu vé vào không :D nếu biết trước về Azure đi cái này chắc sẽ hỏi được rất nhiều đấy.
  5. hoangtoncom

    hoangtoncom Thành Viên Mới

  6. taurus121

    taurus121 Thành Viên Mới

    Sự kiện năm nay sẽ full ngày, riêng buổi chiều là developer tracks, là những buổi nối chuyện với các chủ đề riêng và bạn có thể chọn 1 cái để nghe tùy theo sở thích và mối quan tâm của mình.
  7. hoangtoncom

    hoangtoncom Thành Viên Mới

    Đây là lịch trình cho ngày hôm đó nè.

    Chia sẻ tài liệu Microsoft Cognitive Services - 264382
  8. chuppachupp

    chuppachupp Thành Viên Mới

    Sự kiện này dành cho doanh nghiệp, cho IT. Các đại diện doanh nghiệp IT lớn đảm bảo sẽ có mặt đủ, nếu có ý định tìm hiểu thật thì hãy điền form sớm nhé.
  9. chiakii

    chiakii Thành Viên Mới

    Ngon. Thích tất cả của MS trừ cái trình duyệt web. Azure xài phê thôi rồi.:D

  10. chiakii

    chiakii Thành Viên Mới

    Năm ngoái có lucky draw ko bạn, năm nay Lenovo tài trợ nên sẽ chơi trò bốc thăm trúng thưởng cho khách tham gia. Gồm 2 giải, mỗi giải 1 chiếc
    1. ThinkPad X1 Carbon Gen 6 (MTM: 20KHS01800)
    2. ThinkPad E480 (MTM: 20KN005HVN)
  11. chuppachupp

    chuppachupp Thành Viên Mới

    Đúng rồi, ai tham gia event sẽ được bốc thăm may mắn nhé. Tui thích mấy trò hên xui lắm =))

    Mình thấy nếu biết trước về Azure đi cái này chắc sẽ hỏi được rất nhiều
  12. thuydo2211

    thuydo2211 Thành Viên Mới

    Đối tượng nhắm đến chủ yếu là các doanh nghiệp, startup đến để tìm hiểu chứ ko phải chỉ đến để nhận quà nên phần này cho vui thôi
  13. ladkool

    ladkool Thành Viên Mới

    Mới xem cái clip shows off HoloLens 2 của Microsoft. Quá ấn tượng, Giá hạ dưới 1500$ + nhỏ gọn hơn nữa là có triển vọng thay điện thoại. tiếc là Mic không định hướng hololens theo hướng này:
  14. thuydo2211

    thuydo2211 Thành Viên Mới

    Về mảng kính thực tế ảo thì MS là bá chủ rồi. Không có đối thủ
  15. hoangtoncom

    hoangtoncom Thành Viên Mới

    Con này AR không phải VR. Mảng này MS bá đạo rồi. Quân đội Mỹ còn ký kết hợp đồng. Tuyệt vời
  16. chuppachupp

    chuppachupp Thành Viên Mới

    Cái này ứng dụng được nhiều hơn vr, mà chơi game chắc trải nghiệm cũng thích hơn, chơi thử cái PlayStation VR mà chóng hết cả mặt
  17. taurus121

    taurus121 Thành Viên Mới

    VR mà đeo chóng mặt thì cái này cũng ko hết bệnh của bạn đâu :)
  18. chuppachupp

    chuppachupp Thành Viên Mới

    Khác nhau nhiều chứ, đeo vr nó giả lập hết cả ko gian cho mình, quay đi quay lại vẫn có độ trễ nhất định. còn cái ar nó tạo vật thể dựa vào ko gian thật làm sao thấy khó chịu đc
  19. chiakii

    chiakii Thành Viên Mới

    Còn tùy là game gì. AR chỉ chơi game casual, tactic, moba... túm lại là những game không có không gian mở 3D.
  20. tutitu

    tutitu Thành Viên Mới

    Bệnh chóng mặt của bạn không liên quan đến độ trễ của màn hình nha bạn, thực tế là PS VR là thiết bị có độ trễ rất thấp.
    Còn cái HoloLens này cũng không phải AR nốt.. Nó kết hợp giữa VR và AR, MS gọi là MR (Mixed Reality)

Chia sẻ trang này

Quan tâm nhiều
hỏi đáp
hỏi đáp
bởi dungminhminh, 12 Tháng mười một 2019 lúc 16:10
tìm mua máy
tìm mua máy
bởi thanhcong999, 6 Tháng mười một 2019
Chọn mua laptop mỏng nhẹ, giá trên dưới 25tr
Chọn mua laptop mỏng nhẹ, giá trên dưới 25tr
bởi Són Ca, 12 Tháng mười một 2019 lúc 08:56