સાયન્સ એન્ડ ટેકનોલોજી

ગૂગલે નવું યુનિવર્સલ સ્પીચ મોડલ (USM) રજૂ કર્યું, 1000 ભાષાઓને સપોર્ટ કરે છે

આજના ટેકનોલોજીના યુગમાં AI નું ચલણ વધ્યું છે ત્યારે ટેક જાયન્ટ ગૂગલે Open AI સાથે સ્પર્ધા કરવા માટે તેના નવા યુનિવર્સલ સ્પીચ મોડલ (USM) માં અપડેટ રજૂ કર્યું છે. વાસ્તવમાં, તે 1,000 ભાષાઓને સપોર્ટ કરતું ભાષણ મોડેલ છે. યુનિવર્સલ સ્પીચ મોડલ વિશે, સંશોધક કહે છે કે તે ઓટોમેશન સ્પીચ રેકગ્નિશનના તમામ સેગમેન્ટ્સ Open AI કરતા સારુ પ્રદર્શન કરે છે. જેમ કે તે વધુ સારા YouTube કૅપ્શન્સ લખી શકે છે.

આ પણ વાંચો : ગૂગલના AI Bardના એક ખોટા જવાબથી કંપનીને કરોડો રૂપિયાનું નુકસાન, જાણો શું મુદ્દો શું છે

ગૂગલનું યુનિવર્સલ સ્પીચ મોડલ (USM) શું છે?

USM એ બે બિલિયન પેરામીટર્સ સાથે સ્પીચ મોડલનું ગ્રુપ છે અને તેને 12 મિલિયન કલાકના ભાષણ અને 300 થી વધુ ભાષાઓને આવરી લેતા ટેક્સ્ટના 28 બિલિયન વાક્યોના વિશાળ ડેટાસેટ પર તાલીમબદ્ધ કરવામાં આવ્યું છે. આ મૉડલનો ઉપયોગ YouTube (બંધ કૅપ્શન્સ માટે)માં થાય છે અને તે માત્ર વ્યાપકપણે બોલાતી ભાષાઓ પર જ નહીં પરંતુ કેટલીક ભાષાઓ જેવી કે એમ્હારિક, સેબુઆનો, આસામી અને અઝરબૈજાની પર પણ સ્વચાલિત વાણી ઓળખ કરી શકે છે.

આ પણ વાંચો :ગૂગલે 10 ટકા દંડ જમા કરવા સામે દાખલ કરેલી અરજી ફગાવી દેવાઇ

ગૂગલના જણાવ્યા અનુસાર, USM એટલે કે યુનિવર્સલ સ્પીચ મોડલ ઓટોમેટિક સ્પીચ રેકગ્નિશન સ્કેલિંગના આધારે 1000 થી વધુ ભાષાઓને ઓળખી શકે છે. તે જ સમયે, આ મોડેલની મદદથી બહુભાષી ડેટાસેટ્સને પણ ઓળખી શકાય છે.

કંપનીના જણાવ્યા અનુસાર, આ મોડલની મદદથી એન્કોડરનો ઉપયોગ પ્રી-ટ્રેન કરવા અને તાલીમ પ્રક્રિયામાં નવી ભાષાઓ અને ડેટાનો અસરકારક રીતે ઉપયોગ કરવા માટે કરી શકાય છે. સરળ શબ્દોમાં કહીએ તો, આ મોડેલની મદદથી, ઘણી ભાષાઓના ડેટાને સરળતાથી ફિલ્ટર કરી શકાય છે અને તેનો ઉપયોગ સામગ્રી અને ભાષણ માટે પણ કરી શકાય છે.

આ પણ વાંચો : હવે ગૂગલ મેસેજ પર માણો ગ્રુપ ચેટ્સની મજા ! જાણો આ નવા ફિચર વિશે

શું USM OpenAI કરતાં વધુ સારુ છે?

સંશોધકોએ આ મોડલ સાથે YouTube કૅપ્શન્સના બહુભાષી સ્પીડ ડેટા પર ફાઇન-ટ્યુનિંગ દ્વારા પ્રી-ટ્રેન્ડ એન્કોડરની અસરકારકતા પણ દર્શાવી હતી. YouTubeના મર્યાદિત ડેટા હોવા છતાં, મોડેલે 73 ભાષાઓમાં સરેરાશ 30 ટકા કરતાં ઓછી શબ્દ ભૂલો કરી, જે અગાઉ ક્યારેય હાંસલ કરવામાં આવી ન હતી. સંશોધકોના મતે, USM ઓટોમેશન ભાષા ઓળખના તમામ સેગમેન્ટમાં Open AI કરતા સારુ પ્રદર્શન કરે છે.

USM મશીન લર્નિંગ પર આધારિત છે

તમને જણાવી દઈએ છીએ કે ગૂગલે મશીન લર્નિંગ મોડલ બનાવવા માટે વિશ્વની સૌથી વધુ બોલાતી 1,000 ભાષાઓનો ઉપયોગ કર્યો છે. તે સૌપ્રથમ નવેમ્બર 2022 માં રજૂ કરવામાં આવ્યું હતું. જો કે, આમાં કેટલીક ભાષાઓ 20 મિલિયનથી ઓછા લોકો બોલે છે, તેથી ગૂગલ તેમના મર્યાદિત ઉપલબ્ધ ડેટા અને કેટલાક સ્પીકર્સના આધારે ડેટા એકત્રિત કરી રહ્યું છે. આ મશીન લર્નિંગ મોડલમાં લગભગ તમામ ભાષાઓમાંથી ડેટા એકત્ર કરીને યુનિવર્સલ સ્પીચ મોડલ (USM) તૈયાર કરવામાં આવી રહ્યું છે. એટલે કે ગૂગલનું નવું યુનિવર્સલ સ્પીચ મોડલ તમામ ભાષાઓમાં વધુ સચોટ માહિતી આપી શકશે.

Back to top button