मराठी भाषेचे लहजे गोळा करण्यासाठी महाराष्ट्रातील जिल्ह्यांमध्ये मदत हवी आहे.

Submitted by सई. on 6 June, 2024 - 02:59

नमस्कार मायबोलीकर मित्रमंडळी !!!
कसे आहात तुम्ही सगळेजण?

महाराष्ट्रातील जिल्ह्याजिल्ह्यात विखुरलेल्या मायबोलीकर बांधवांना एका महत्त्वाच्या कामासाठी साद द्यायला आम्ही आलोय.

AI4Bharat ही IIT मद्रासमधील एक रिसर्च लॅब आहे जी भारतीय भाषांसाठी ओपन सोर्स डेटासेट, टूल्स, मॉडेल आणि अ‍ॅप्लिकेशन्स विकसित करण्यावर काम करत आहे. गेल्या वर्षभरापासून, आम्ही आपल्या संविधानात नमूद असलेल्या २२ भाषांसाठी संपूर्ण भारतातून स्पीच डेटा (नेटिव्ह स्पीकर्स रेकॉर्डिंग) म्हणजेच बोलीभाषेतील संवादाचे ध्वनीमुद्रण गोळा करत आहोत. इलेक्ट्रॉनिक्स आणि माहिती तंत्रज्ञान मंत्रालयाच्या भाषिणी प्रकल्पांतर्गत, आम्ही मूळ मराठी भाषिक लोकांच्या आवाजाचे नमुने गोळा करण्यासाठी वेगवेगळ्या जिल्ह्यांमध्ये एक कार्यक्रम आयोजित करतो, ज्यामध्ये आम्ही स्थानिक लोकांचे आवाज त्यांच्याच मोबाईलमधील एका अ‍ॅपमधे (ai4bharat kathbath) रेकॉर्ड करतो. विदर्भातील काही जिल्हे, रायगड व मुंबई जिल्ह्यामधून आम्ही यशस्वीपणे डेटा गोळा केला आहे. आता, त्याचाच पुढचा भाग कुडाळ, रत्नागिरी, पुणे येथे टप्प्या-टप्प्याने सुरु करत आहोत. त्यानंतर आम्ही अमरावती, भंडारा, बुलढाणा, चंद्रपूर, गडचिरोली, गोंदिया, हिंगोली, जळगाव, लातूर, नांदेड, नंदूरबार, उस्मानाबाद, परभणी, सातारा, वाशिम, अहमदनगर भागातही जाणार आहोत. यासाठी आम्हाला मायबोलीकर बांधवांच्या मदतीची आवश्यकता आहे.
मदतीचं स्वरुप थोडक्यात सांगते.

1. आमच्या या रेकॉर्डिंगच्या कामासाठी आम्हाला सहा ते सात खोल्या लागतात, ज्यांच्या आजूबाजूला बांधकामाचे, रहदारीचे किंवा तत्सम आवाज नसावेत, जेणेकरुन रेकॉर्डिंग करणा-याचा आवाज दाबला जाणार नाही. अशा खोल्या सहसा एखादी शाळा, कॉलेज, क्लासेस किंवा विद्यापीठात आढळतात. हॉटेलमधेही असतात. पण तो अंतिम पर्याय आहे. त्यामुळे अशी जागा हवी जी दळणवळणाच्या दृष्टीकोनातून पाहिलं तर सहज गाठणे शक्य आहे. प्रत्येक जिल्ह्यात अशा एखाद्या जागी तुमचा संपर्क असेल तर त्याची माहिती व संपर्क क्रमांक हवा आहे.
2. त्याबरोबरच दुसरी अपेक्षा आहे ती म्हणजे जवळच राहण्याची सोय. तुम्ही सुचवलेल्या स्थानाच्या जवळच असलेल्या एखाद्या हॉटेलची
किंवा हॉस्टेलची माहिती दिलीत तर प्रकल्पातील कार्यकर्त्यांच्या राहण्याची सोय करता येईल.
3. तिसरी आणि महत्त्वाची गोष्ट म्हणजे या प्रकल्पात सहभागी होण्यासाठी लागणारी माणसं. प्रत्येक जिल्ह्यातून आम्हाला दोनशे माणसं अपेक्षित असतात. तेही अठराच्या वर असलेले म्हणजे अठरा ते तीस, तीस ते पंचेचाळीस, पंचेचाळीस ते साठ आणि साठच्या वर वय असलेले. त्यातही विद्यार्थी, बेरोजगार, नोकरदार, व्यवसायिक अशा शक्य तेवढ्या सर्व श्रेणी असाव्यात. थोडक्यात प्रत्येक क्षेत्रातले व वेगवेगळ्या वयोगटातले. पुरुष व महिला सहभागी अपेक्षित आहेत.

ह्या सहभागी व्यक्तींच्या रेकॉर्डिंगसाठी आम्ही कमीत कमी दोन स्थानिक लोकांना हंगामी तत्वावर काम देतो. आमच्यासोबत रेकॉर्डिंग करणा-या व्यक्तीलाही मानधन दिले जाते. याशिवाय रेकॉर्ड केलेल्या माहितीची गुणवत्ता चाचणी पूर्ण झाल्यानंतर, प्रत्येक स्वीकारलेल्या सहभागी व्यक्तीच्या बँक खात्यात 500/- रुपयांचे मानधन पाठवले जाते. त्यामुळे या कामात आपला अमुल्य वेळ देणा-या व्यक्तीला फुल ना फुलाची पाकळी म्हणून एक आर्थिक मदत होते.
सध्या आम्ही पाऊस सुरु होण्यापुर्वी सिंधूदुर्ग व रत्नागिरी पूर्ण करुन पुण्याच्या दिशेने मार्गक्रमण करण्याच्या विचारात आहोत. त्यामुळे साधारण जुलैमध्ये वरील जिल्ह्यात जाणं होईल. त्यातही पावसाचे दिवस असल्याने जिथे पाऊस कमी अशा जागांना प्राधान्य दिलं जाणार आहे. त्यानंतर इतर ठिकाणे.
तर जे मायबोलीकर वरील जिल्ह्यात राहतात त्यांनी जर योग्य व्यक्ती व योग्य जागा सुचवल्या तर आम्हाला या प्रकल्पाला योग्य चालना देता येईल. आमच्या कामाच्या व राहण्याच्या जागा वेळेत ठरवून योजनाबद्ध पद्धतीने काम करता येईल.
या प्रकल्पाला ज्यांना मदत करावीशी वाटेल ते खालील क्रमांकावर संपर्क साधू शकतात.
कौतुक शिरोडकर - 9834875172
आमच्याबद्दल आणखी जाणून घेण्यासाठी आमच्या संकेतस्थळाला भेट द्या: https://ai4bharat.iitm.ac.in/

या कार्यक्रमात आपला सहभाग सुनिश्चित करून मराठी भाषेच्या प्रगतीला हातभार लावा. तुमचा एक छोटासा प्रयत्न मराठी भाषेच्या विकासात मोठा बदल घडवून आणू शकतो. तुमच्या सहभागासाठी आम्ही तुमची आतुरतेने वाट पाहत आहोत.

धन्यवाद,
AI4bharat Team

Group content visibility: 
Public - accessible to all site users

एक प्रश्न - महाराष्ट्रात, क्वचितच का होईना), मराठी बोलले जाते, तसे आजकाल इतर देशातहि भरपूर मराठी लोक पसरले आहेत. गेली कित्येक वर्षे ते अजूनहि पुष्कळ पुणे मुंबईकरांपेक्षा जास्त स्वच्छ मराठी बोलतात. कदाचित मराठीतील बर्‍याच वाक्यरचना मूळ मराठी स्वरूपात इकडे बोलल्या जातात.
जसे, मला मदत करा, माझी मदत करा, नाही.
कुवत. औकात नव्हे.

तर त्याचे काय? तेपण ध्वनिमुद्रित (भारतात ज्याला रेकॉर्डिंग म्हणतात,) करणार काय?

उप्क्रमाला शुभेच्छा!

सहज आठवलं, तंजावूर मध्येही मराठी लोक बरीच वर्षे स्थायीक आहेत, त्यांची एक वेगळीच मराठी बोली आहे. फारच गोड. तिचेही नमुने गेत अहात का ? ते फार लांबही नसावे.

<<त्याचाच पुढचा भाग कुडाळ, रत्नागिरी, पुणे येथे टप्प्या-टप्प्याने सुरु करत आहोत. त्यानंतर आम्ही अमरावती, भंडारा, बुलढाणा, चंद्रपूर, गडचिरोली, गोंदिया, हिंगोली, जळगाव, लातूर, नांदेड, नंदूरबार, उस्मानाबाद, परभणी, सातारा, वाशिम, अहमदनगर भागातही जाणार आहोत.<<<

यात धुळे नाही काय? Happy कारण नन्दुरबारची अहिराणीचा लहेजा जरा गुजराथीकडे झुकणारा आहे. जळगावी अहिराणीचा वेगळा आणी धुळ्याचा वेगळा.

सध्या महाराष्ट्रातील मराठी इतकाच पर्याय उपलब्ध आहे. या कामासाठी महाराष्ट्रात फिरुन नमुने गोळा करणे तसेही खर्चिक काम आहे. त्यात पुन्हा परदेशी जाणे म्हणजे जरा अशक्यच.
तंजावूरप्रमाणेच कारवार बेळगाव आहेच. पण वर सांगितल्याप्रमाणे सध्या महाराष्ट्राबाहेर जाणे नाही.
दोनेक संस्था यावर काम करत आहेत. कदाचित धुळेमधील काम झालं असावं. सध्या आमच्याकडे हिच यादी आहे. इथे कुणी काही सुचवू शकत असाल तर नक्की सुचवा.

असे गावोगाव फिरण्यापेक्षा एखादे मोबाईल अँप बनवून त्याच्यावर लोकांना घरबसल्या त्यांच्या आवाज रेकॉर्ड करण्याचा मार्ग कसा वाटतो? अर्थात तुम्ही या पर्यायाचा विचार केला असेलच म्हणा. पण तो पर्याय का नाकारला याचे कुतूहल आहे.

सर्वांचे आभार.
@नन्द्या७५, परदेशात स्थायिक असणारे लोक इथूनच तिकडे गेलेले असल्यामुळे त्यांच्या मूळ भागात जी रेकॉर्डिंग्ज होतील, त्यात त्यांचे लहजे आपोआप कव्हर होतील.

@माबो वाचक, मोबाईल अ‍ॅपवरच रेकॉर्ड करुन घेणे चालू आहे. समोर बसून करून घेण्यामागे अनेक कारणे आहेत. भरपूर प्रश्नावल्या तयार केल्या आहेत. ज्या स्वरुपाची आणि ज्या भागातील व्यक्ती असेल त्यानुसार प्रश्न विचारले जातात. आपल्याला लहजांबरोबरच विविध प्रकारचा आणि विशिष्ट, असे दोन्ही शब्दसंग्रह देखिल गोळा करायचे आहेत आणि ते विविध आवाजांमध्ये आणि विविध वयोगटांचे घ्यायचे असल्याने ते साधले जातेय हे पाहणे प्रत्यक्ष करून घेण्यातच शक्य होते. अनावश्यक पुनरावृत्ती किंवा अडखळणे टाळणे, वक्त्याला आश्वस्त करणे, गरज भासल्यास काही मार्गदर्शन करणे या बाबी परोक्ष शक्य होणार नाहीत. मागचे आवाज, गोंगाट येणार नाहीत, आवश्यक ठराविक कालावधी पूर्ण होईल याची दक्षता घ्यावी लागते. खरोखरच वेगवेगळी माणसे बोलत आहेत, फसवणूक होत नाही ना, याची खतरजमा केवळ प्रत्यक्ष हजर राहूनच शक्य आहे.

आपल्याकडे काम कसेतरी उरकण्याचे, पाट्या टाकण्याचे कसब असते. या वृत्तीमुळे सुरुवातीच्या ध्वनीमुद्रणांमध्ये रिजेक्शनचा दर प्रचंड होता, जो परवडणारा नाही. शिवाय करंज्या करताना जशा शेवटपर्यंत शेपट्या निघत राहतात तसे इथेही होते आणि संशोधन प्रकल्प असल्यामुळे त्या इश्शूजचे निरसन होऊन रिजेक्शन शून्य होईल हा कटाक्ष केवळ प्रत्यक्ष काम करून घेणारे लोकच ठेवू शकतात.

सगळ्याच जिल्ह्यांमध्ये हा उपक्रम होणार आहे, सगळ्या जिल्ह्यांचा उल्लेख केल्यास विनाकारण पोस्ट लांबली असती.
तंजावूर, कारवार, बेळगाव, गोवा, इंदूर, ग्वाल्हेर अशा महाराष्ट्राबाहेरील मराठी भाषा बहुल ठिकाणी त्या त्या मूळ भाषांच्या ध्वनिमुद्रणांच्या वेळी मराठीचे नमुने देखिल गोळा केले जाणार आहेत.

कौतुकने उल्लेख केल्याप्रमाणे आर्थिक गणिते जिकीरीची आहेत, तो ताळमेळ घालत काम पुढे नेणे सुरू आहे.
कृपया तुमच्या सूचना, शंका जरूर येऊ द्या, आम्ही त्या कशा पद्धतीने विचारात घेता येतील ते अवश्य पाहू. आमच्या नजरेतून निसटलेले मुद्दे आले तर तीसुद्धा मदत ठरेल.
धन्यवाद Happy

उत्तम प्रकल्प आहे.

तरुण जनतेचे लहजे अवश्य घ्या असे सुचवीन. फार फरक आहे
तरुणांच्या आणि प्रौढांच्या भाषेत / उच्चारणात !

पुढे निष्कर्ष काय निघाले याबद्दल वाचायला आवडेल.

अनेकानेक शुभेच्छा

नमस्कार !!

AI4भारत मध्ये तुमचे स्वागत आहे !

AI4Bharat ही IIT मद्रासमधील एक रिसर्च लॅब आहे जी भारतीय भाषांसाठी ओपन सोर्स डेटासेट, टूल्स, मॉडेल आणि एप्लिकेशन्स विकसित करण्यावर काम करत आहे. गेल्या वर्षभरापासून, आम्ही आपल्या संविधानात नमूद असलेल्या २२ भाषांसाठी संपूर्ण भारतातून स्पीच डेटा (नेटिव्ह स्पीकर्स रेकॉर्डिंग) म्हणजेच बोलीभाषेतील संवादाचे रेकॉर्डिंग गोळा करत आहोत. इलेक्ट्रॉनिक्स आणि माहिती तंत्रज्ञान मंत्रालयाच्या भाषिणी प्रकल्पांतर्गत, आम्ही मूळ मराठी भाषिक लोकांच्या आवाजाचे नमुने गोळा करण्यासाठी वेगवेगळ्या जिल्ह्यांमध्ये एक कार्यक्रम आयोजित करतो, ज्यामध्ये आम्ही स्थानिक लोकांचे आवाज त्यांच्याच मोबाईलमधील एका एपमधे रेकॉर्ड करतो. विदर्भ, रायगड, मुंबई आणि सिंधूदुर्ग जिल्ह्यामधून आम्ही यशस्वीपणे डेटा गोळा केला आहे. आता पुणे येथे येत्या 29 जूनपासून 10 जुलैपर्यंत हा कार्यक्रम आयोजित केला जाणार आहे. पुणे एसएनडीटी येथे रेकॉर्डिंग केलं जाणार आहे. सर्वांनी यात सहभागी व्हावे ही नम्र विनंती !
कौतुकाची थाप म्हणून, रेकॉर्ड केलेल्या माहितीची गुणवत्ता चाचणी पूर्ण झाल्यानंतर प्रत्येक स्वीकारलेल्या सहभागी व्यक्तीला त्यांच्या बँक खात्यात 500/- रुपयांचे मानधन दिले जाईल.
कृपया लक्षात घ्या की आम्ही या कार्यक्रमासाठी एका जिल्ह्यातील फक्त 150 ते 200 लोकांनाच आमंत्रित करू शकतो. तुमचा आवाज मराठीत नोंदवण्यासाठी खालील नंबरवर संपर्क साधा.
आमच्याबद्दल आणखी जाणून घेण्यासाठी आमच्या संकेतस्थळाला भेट द्या: https://ai4bharat.iitm.ac.in/
प्रतिनिधी संपर्क क्रमांक: कौतुक शिरोडकर - 9834875172, मकरंद सामंत 9404259250, निनाद खाडिलकर 9404431255, सिद्धेश कदम 7798797263 गौरी काळे 9657207792
विशेष सूचना:-
१. अर्जदार 18 वर्षांपेक्षा जास्त वयाचा असावा.
२. रेकॉर्डिंगसाठीचा मजकूर मराठीत असेल.
३. येताना आपले आधार कार्ड सोबत ठेवावे.
४. तुमचा व्यवस्थित चार्ज केलेला फोन (Android किंवा सामान्य फोन ) येताना सोबत घेऊन यावा. आयफोन या
कामासाठी उपयुक्त नाही.
५. रेकॉर्डिंग पूर्ण करण्यासाठी एका सहभागीस सुमारे 2.00 ते 2.30 तासाचा कालावधी लागतो.
धन्यवाद,
AI4Bharat Team