તમારા માથામાં ફરતા શબ્દો વિશે વિચારો: તે સ્વાદવિહીન મજાક તમે સમજદારીપૂર્વક રાત્રિભોજન સમયે તમારી જાતને રાખી હતી; તમારા શ્રેષ્ઠ મિત્રના નવા જીવનસાથીની તમારી અવાજહીન છાપ. હવે કલ્પના કરો કે કોઈ સાંભળી શકે.
સોમવારે, યુનિવર્સિટી ઓફ ટેક્સાસ, ઓસ્ટિનના વૈજ્ઞાનિકોએ તે દિશામાં વધુ એક પગલું ભર્યું. એક પ્રકાશિત અભ્યાસમાં નેચર ન્યુરોસાયન્સ જર્નલમાંસંશોધકોએ AIનું વર્ણન કર્યું છે જે એફએમઆરઆઈ સ્કેનનું વિશ્લેષણ કરીને માનવ વિષયોના ખાનગી વિચારોનું ભાષાંતર કરી શકે છે, જે મગજના વિવિધ પ્રદેશોમાં રક્ત પ્રવાહને માપે છે.
પહેલેથી જ, સંશોધકોએ ભાષા ડીકોડિંગ પદ્ધતિઓ વિકસાવી છે પ્રયાસ કરેલ ભાષણ પસંદ કરો એવા લોકો કે જેમણે બોલવાની અને મંજૂરી આપવાની ક્ષમતા ગુમાવી દીધી છે લોકો લખવા માટે લકવાગ્રસ્ત છે જ્યારે માત્ર લખવાનું જ વિચારી રહ્યા છો. પરંતુ નવી ભાષા ડીકોડર એ પ્રથમ છે જે પ્રત્યારોપણ પર આધાર રાખતા નથી. અભ્યાસમાં, તે વ્યક્તિની કાલ્પનિક વાણીને વાસ્તવિક ભાષણમાં ફેરવવામાં સક્ષમ હતો, અને જ્યારે વિષયોને સાયલન્ટ મૂવીઝ બતાવવામાં આવી હતી, ત્યારે તે સ્ક્રીન પર શું થઈ રહ્યું હતું તેનું પ્રમાણમાં સચોટ વર્ણન જનરેટ કરી શક્યો હતો.
“આ માત્ર એક ભાષાકીય ઉત્તેજના નથી,” યુનિવર્સિટીના ન્યુરોસાયન્ટિસ્ટ એલેક્ઝાન્ડર હુથે જણાવ્યું હતું કે જેમણે સંશોધનનું નેતૃત્વ કરવામાં મદદ કરી હતી. “અમે અર્થ મેળવી રહ્યા છીએ, શું થઈ રહ્યું છે તેના વિચાર વિશે કંઈક. અને હકીકત એ છે કે તે શક્ય છે તે ખૂબ જ રોમાંચક છે.”
અભ્યાસમાં ત્રણ સહભાગીઓ પર ધ્યાન કેન્દ્રિત કરવામાં આવ્યું હતું, જેઓ “ધ મોથ” અને અન્ય વર્ણનાત્મક પોડકાસ્ટ સાંભળવા માટે ઘણા દિવસોથી 16 કલાક સુધી ડૉ. હુથની લેબમાં આવ્યા હતા. જેમ જેમ તેઓએ સાંભળ્યું તેમ, એક એફએમઆરઆઈ સ્કેનર તેમના મગજના ભાગોમાં રક્ત ઓક્સિજનનું સ્તર રેકોર્ડ કરે છે. સંશોધકોએ પછી મગજની પ્રવૃત્તિની પેટર્નને સહભાગીઓએ સાંભળેલા શબ્દો અને વાક્યો સાથે મેચ કરવા માટે એક વિશાળ ભાષા મોડેલનો ઉપયોગ કર્યો.
OpenAI ના GPT-4 અને Google’s Bard જેવા મોટા લેંગ્વેજ મોડલ્સને વાક્ય અથવા વાક્યમાં આગળના શબ્દની આગાહી કરવા માટે મોટા પ્રમાણમાં ટાઈપિંગ પર તાલીમ આપવામાં આવે છે. પ્રક્રિયામાં, મોડેલો નકશા બનાવે છે જે દર્શાવે છે કે શબ્દો એકબીજા સાથે કેવી રીતે સંબંધિત છે. થોડા વર્ષો પહેલા હુથ નોંધ્યું આ નકશાના કયા ચોક્કસ ટુકડાઓ-જેને સંદર્ભ એમ્બેડિંગ્સ કહેવાય છે, જે વાક્યોના સિમેન્ટીક લક્ષણો અથવા અર્થોને કેપ્ચર કરે છે-ભાષાના પ્રતિભાવમાં મગજ કેવી રીતે પ્રકાશિત થાય છે તેની આગાહી કરવા માટે ઉપયોગ કરી શકાય છે.
મૂળભૂત અર્થમાં, શિન્જી નિશિમોટો, ઓસાકા યુનિવર્સિટીના ન્યુરોસાયન્ટિસ્ટ કે જેઓ સંશોધનમાં સામેલ ન હતા, જણાવ્યું હતું કે, “મગજની પ્રવૃત્તિ એ એક પ્રકારનું એન્ક્રિપ્ટેડ સિગ્નલ છે, અને ભાષાના મોડલ તેને સમજવાની રીતો પ્રદાન કરે છે.”
તેમના અભ્યાસમાં, ડૉ. હુથ અને તેમના સાથીદારોએ સહભાગીની fMRI છબીઓને શબ્દો અને વાક્યોમાં અનુવાદિત કરવા માટે અન્ય AI નો ઉપયોગ કરીને પ્રક્રિયાને અસરકારક રીતે ઉલટાવી. સંશોધકોએ સહભાગીઓને નવા રેકોર્ડિંગ્સ સાંભળીને ડીકોડરનું પરીક્ષણ કર્યું, અને પછી તપાસ્યું કે અનુવાદ વાસ્તવિક ટ્રાન્સક્રિપ્ટ સાથે કેટલી સારી રીતે મેળ ખાય છે.
ડીકોડેડ સ્ક્રિપ્ટમાં લગભગ દરેક શબ્દ સ્થાનની બહાર હતો, પરંતુ પેસેજનો અર્થ નિયમિતપણે સાચવવામાં આવ્યો હતો. આવશ્યકપણે, ડીકોડર્સ પેરાફ્રેસિંગ હતા.
મૂળ ટ્રાન્સક્રિપ્ટ: “હું હવાના ગાદલામાંથી ઉભો થયો અને બેડરૂમની બારીનાં કાચ સામે મારો ચહેરો દબાવ્યો અને મારી સામે તાકી રહેલી આંખો જોવાની અપેક્ષા રાખતો હતો, પરંતુ તેના બદલે માત્ર અંધકાર જ દેખાયો.”
મગજની પ્રવૃત્તિમાંથી ડીકોડેડ: “હું ફક્ત બારી તરફ જતો રહ્યો અને કાચ ખોલતો રહ્યો. હું ઉભો થયો અને બહાર જોયું, મને કંઈ દેખાતું નહોતું અને મેં પાછળ જોયું તો મને કંઈ દેખાતું ન હતું.”
જ્યારે એફએમઆરઆઈ સ્કેન હેઠળ, સહભાગીઓને ચુપચાપ પોતાની વાર્તા કહેવાની કલ્પના કરવાનું પણ કહેવામાં આવ્યું હતું; પછી, તેઓએ સંદર્ભ માટે, મોટેથી વાર્તાનું પુનરાવર્તન કર્યું. અહીં પણ, ડીકોડિંગ મોડેલે અસ્પષ્ટ સંસ્કરણનો સાર મેળવ્યો.
સહભાગી સંસ્કરણ: “મારી પત્ની તરફથી એવો સંદેશ શોધો કે તેણીએ પોતાનો વિચાર બદલી નાખ્યો છે અને તે પાછી આવી રહી છે.”
ડીકોડેડ સંસ્કરણ: “કોઈ કારણોસર તેણીને જોવા માટે મને લાગ્યું કે તેણી મારી પાસે આવશે અને કહેશે કે તેણી મને ચૂકી ગઈ છે.”
છેલ્લે, વિષયોએ એક ટૂંકી એનિમેટેડ ફિલ્મ મૌનથી જોઈ, ફરી એક એફએમ એમઆરઆઈ સ્કેન દરમિયાન. તેમની મગજની પ્રવૃત્તિનું પૃથ્થકરણ કરીને, ભાષાનું મોડેલ તેઓ જે જોઈ રહ્યા હતા તેનો રફ સારાંશ ડીકોડ કરી શકે છે, કદાચ તેઓ જે જોઈ રહ્યા હતા તેનું આંતરિક વર્ણન.
પરિણામ સૂચવે છે કે AI ડીકોડર માત્ર શબ્દોને જ નહીં પણ અર્થને પણ કેપ્ચર કરી રહ્યું હતું. “ભાષાની ધારણા એ બાહ્ય રીતે ચાલતી પ્રક્રિયા છે, જ્યારે કલ્પના એ એક સક્રિય આંતરિક પ્રક્રિયા છે,” ડૉ. નિશિમોટોએ કહ્યું. “અને લેખકોએ બતાવ્યું કે મગજ આ પ્રક્રિયાઓમાં સામાન્ય રજૂઆતોનો ઉપયોગ કરે છે.”
ગ્રેટા ટુકુટે, મેસેચ્યુસેટ્સ ઇન્સ્ટિટ્યુટ ઑફ ટેક્નોલોજીના ન્યુરોસાયન્ટિસ્ટ કે જેઓ સંશોધનમાં સામેલ ન હતા, તેમણે કહ્યું કે તે “ઉચ્ચ સ્તરનો પ્રશ્ન છે.”
“શું આપણે મગજનો અર્થ ડીકોડ કરી શકીએ?” તેણીએ ચાલુ રાખ્યું. “કોઈ રીતે તેઓ દર્શાવે છે કે, હા, અમે કરી શકીએ છીએ.”
ભાષાને ડીકોડ કરવાની આ પદ્ધતિમાં મર્યાદાઓ હતી, ડૉ. હુથ અને તેમના સાથીદારોએ નોંધ્યું. એક બાબત માટે, એફએમઆરઆઈ સ્કેનર્સ વિશાળ અને ખર્ચાળ છે. ઉપરાંત, મોડેલને તાલીમ આપવી એ એક લાંબી અને કંટાળાજનક પ્રક્રિયા છે, અને અસરકારક બનવા માટે તે લોકો પર થવી જોઈએ. જ્યારે સંશોધકોએ બીજાના મગજની પ્રવૃત્તિને વાંચવા માટે એક વ્યક્તિ પર પ્રશિક્ષિત ડીકોડરનો ઉપયોગ કરવાનો પ્રયાસ કર્યો, ત્યારે તે નિષ્ફળ ગયો, જે સૂચવે છે કે દરેક મગજમાં અર્થ દર્શાવવાની અનન્ય રીતો છે.
સહભાગીઓ અન્ય વસ્તુઓ વિશે વિચારીને ડીકોડરને ફેંકી દેતા, તેમના આંતરિક એકપાત્રી નાટકોને સુરક્ષિત કરવામાં પણ સક્ષમ હતા. AI આપણું મન વાંચી શકે છે, પરંતુ અત્યારે તેને એક સમયે અને અમારી પરવાનગીથી વાંચવું પડશે.