قوقل تفتح مصدر تقنيات التعرف على محتوى الصور وتوليد وصف نصي

google-show-and-tell-caption3c-930x6071-small

تتطور تقنيات الذكاء الصنعي بشكل كبير وتلعب الشركات التقنية الكبرى دوراً هاماً في ذلك وتوفر أدواتها للمطورين للإستفادة منها. قوقل واحدة من أبرز الشركات في هذا المجال أعلنت اليوم عن فتح نموذج يولد وصف نصي تلقائي لمحتوى الصور بعد مسحها وفهم محتواها.

كانت قوقل قد نشرت ورقة بحث علمي عن نموذج Show and Tell قبل عامين، وفي العام الماضي تم تحديث النموذج وتحسين مستوى الدقة فيه، والآن أصبح مفتوح المصدر متاحاً على GitHub.

ويمكن للمطورين الآن تدريب نموذج الذكاء الصنعي هذا بسرعة أكبر من النماذج القديمة مثل DistBelief الذي كانت تستخدمه قوقل لتوليد وصف نصي عن محتوى الصور.

ودربت قوقل نموذج Show and Tell من خلال عرض صور ووصف نصي كتبه البشر ليتمكن من خلاله فهم الآلية وتوليد وصف أكثر دقة تلقائياً. لكن هذا لايعني أن النموذج قادر على توليد وصف نصي فقط للصور التي يعرفها وتدرب عليها سابقاً بل حتى يمكنه توليد وصف نصي أصيل وخاص به.

قوقل تعد الشركة الأفضل في مجال التعرف على محتوى الصور بواسطة الذكاء الصنعي، حيث يكتفي المنافسون بالتعرف على بعض الأشياء في الصورة، تذهب قوقل أكثر لكتابة وصف نصي أيضاً. وأبرز قدرات قوقل نراها في خدمتها للصور حيث يمكنها البحث وعرض كل الصور التي تطابق كلمة البحث الخاصة بك حتى لو لم تضف وسم للصور.

الجدير بالذكر أن قوقل ليست الوحيدة التي تقدم نماذج توليد وصف للصور بالإعتماد على الذكاء الصنعي مجاناً كنموذج مفتوح المصدر, هناك أيضاً NeuralTalk2 متاح على Github.
المصدر

تعليقات عبر الفيسبوك