नमस्कार मायबोलीकर मित्रमंडळी !!!
कसे आहात तुम्ही सगळेजण?
महाराष्ट्रातील जिल्ह्याजिल्ह्यात विखुरलेल्या मायबोलीकर बांधवांना एका महत्त्वाच्या कामासाठी साद द्यायला आम्ही आलोय.
AI4Bharat ही IIT मद्रासमधील एक रिसर्च लॅब आहे जी भारतीय भाषांसाठी ओपन सोर्स डेटासेट, टूल्स, मॉडेल आणि अॅप्लिकेशन्स विकसित करण्यावर काम करत आहे. गेल्या वर्षभरापासून, आम्ही आपल्या संविधानात नमूद असलेल्या २२ भाषांसाठी संपूर्ण भारतातून स्पीच डेटा (नेटिव्ह स्पीकर्स रेकॉर्डिंग) म्हणजेच बोलीभाषेतील संवादाचे ध्वनीमुद्रण गोळा करत आहोत. इलेक्ट्रॉनिक्स आणि माहिती तंत्रज्ञान मंत्रालयाच्या भाषिणी प्रकल्पांतर्गत, आम्ही मूळ मराठी भाषिक लोकांच्या आवाजाचे नमुने गोळा करण्यासाठी वेगवेगळ्या जिल्ह्यांमध्ये एक कार्यक्रम आयोजित करतो, ज्यामध्ये आम्ही स्थानिक लोकांचे आवाज त्यांच्याच मोबाईलमधील एका अॅपमधे (ai4bharat kathbath) रेकॉर्ड करतो. विदर्भातील काही जिल्हे, रायगड व मुंबई जिल्ह्यामधून आम्ही यशस्वीपणे डेटा गोळा केला आहे. आता, त्याचाच पुढचा भाग कुडाळ, रत्नागिरी, पुणे येथे टप्प्या-टप्प्याने सुरु करत आहोत. त्यानंतर आम्ही अमरावती, भंडारा, बुलढाणा, चंद्रपूर, गडचिरोली, गोंदिया, हिंगोली, जळगाव, लातूर, नांदेड, नंदूरबार, उस्मानाबाद, परभणी, सातारा, वाशिम, अहमदनगर भागातही जाणार आहोत. यासाठी आम्हाला मायबोलीकर बांधवांच्या मदतीची आवश्यकता आहे.
मदतीचं स्वरुप थोडक्यात सांगते.
1. आमच्या या रेकॉर्डिंगच्या कामासाठी आम्हाला सहा ते सात खोल्या लागतात, ज्यांच्या आजूबाजूला बांधकामाचे, रहदारीचे किंवा तत्सम आवाज नसावेत, जेणेकरुन रेकॉर्डिंग करणा-याचा आवाज दाबला जाणार नाही. अशा खोल्या सहसा एखादी शाळा, कॉलेज, क्लासेस किंवा विद्यापीठात आढळतात. हॉटेलमधेही असतात. पण तो अंतिम पर्याय आहे. त्यामुळे अशी जागा हवी जी दळणवळणाच्या दृष्टीकोनातून पाहिलं तर सहज गाठणे शक्य आहे. प्रत्येक जिल्ह्यात अशा एखाद्या जागी तुमचा संपर्क असेल तर त्याची माहिती व संपर्क क्रमांक हवा आहे.
2. त्याबरोबरच दुसरी अपेक्षा आहे ती म्हणजे जवळच राहण्याची सोय. तुम्ही सुचवलेल्या स्थानाच्या जवळच असलेल्या एखाद्या हॉटेलची
किंवा हॉस्टेलची माहिती दिलीत तर प्रकल्पातील कार्यकर्त्यांच्या राहण्याची सोय करता येईल.
3. तिसरी आणि महत्त्वाची गोष्ट म्हणजे या प्रकल्पात सहभागी होण्यासाठी लागणारी माणसं. प्रत्येक जिल्ह्यातून आम्हाला दोनशे माणसं अपेक्षित असतात. तेही अठराच्या वर असलेले म्हणजे अठरा ते तीस, तीस ते पंचेचाळीस, पंचेचाळीस ते साठ आणि साठच्या वर वय असलेले. त्यातही विद्यार्थी, बेरोजगार, नोकरदार, व्यवसायिक अशा शक्य तेवढ्या सर्व श्रेणी असाव्यात. थोडक्यात प्रत्येक क्षेत्रातले व वेगवेगळ्या वयोगटातले. पुरुष व महिला सहभागी अपेक्षित आहेत.
ह्या सहभागी व्यक्तींच्या रेकॉर्डिंगसाठी आम्ही कमीत कमी दोन स्थानिक लोकांना हंगामी तत्वावर काम देतो. आमच्यासोबत रेकॉर्डिंग करणा-या व्यक्तीलाही मानधन दिले जाते. याशिवाय रेकॉर्ड केलेल्या माहितीची गुणवत्ता चाचणी पूर्ण झाल्यानंतर, प्रत्येक स्वीकारलेल्या सहभागी व्यक्तीच्या बँक खात्यात 500/- रुपयांचे मानधन पाठवले जाते. त्यामुळे या कामात आपला अमुल्य वेळ देणा-या व्यक्तीला फुल ना फुलाची पाकळी म्हणून एक आर्थिक मदत होते.
सध्या आम्ही पाऊस सुरु होण्यापुर्वी सिंधूदुर्ग व रत्नागिरी पूर्ण करुन पुण्याच्या दिशेने मार्गक्रमण करण्याच्या विचारात आहोत. त्यामुळे साधारण जुलैमध्ये वरील जिल्ह्यात जाणं होईल. त्यातही पावसाचे दिवस असल्याने जिथे पाऊस कमी अशा जागांना प्राधान्य दिलं जाणार आहे. त्यानंतर इतर ठिकाणे.
तर जे मायबोलीकर वरील जिल्ह्यात राहतात त्यांनी जर योग्य व्यक्ती व योग्य जागा सुचवल्या तर आम्हाला या प्रकल्पाला योग्य चालना देता येईल. आमच्या कामाच्या व राहण्याच्या जागा वेळेत ठरवून योजनाबद्ध पद्धतीने काम करता येईल.
या प्रकल्पाला ज्यांना मदत करावीशी वाटेल ते खालील क्रमांकावर संपर्क साधू शकतात.
कौतुक शिरोडकर - 9834875172
आमच्याबद्दल आणखी जाणून घेण्यासाठी आमच्या संकेतस्थळाला भेट द्या: https://ai4bharat.iitm.ac.in/
या कार्यक्रमात आपला सहभाग सुनिश्चित करून मराठी भाषेच्या प्रगतीला हातभार लावा. तुमचा एक छोटासा प्रयत्न मराठी भाषेच्या विकासात मोठा बदल घडवून आणू शकतो. तुमच्या सहभागासाठी आम्ही तुमची आतुरतेने वाट पाहत आहोत.
धन्यवाद,
AI4bharat Team
उत्तम उपक्रम. तुमच्या
उत्तम उपक्रम. तुमच्या कार्याला शुभेच्छा.
एक प्रश्न - महाराष्ट्रात,
एक प्रश्न - महाराष्ट्रात, क्वचितच का होईना), मराठी बोलले जाते, तसे आजकाल इतर देशातहि भरपूर मराठी लोक पसरले आहेत. गेली कित्येक वर्षे ते अजूनहि पुष्कळ पुणे मुंबईकरांपेक्षा जास्त स्वच्छ मराठी बोलतात. कदाचित मराठीतील बर्याच वाक्यरचना मूळ मराठी स्वरूपात इकडे बोलल्या जातात.
जसे, मला मदत करा, माझी मदत करा, नाही.
कुवत. औकात नव्हे.
तर त्याचे काय? तेपण ध्वनिमुद्रित (भारतात ज्याला रेकॉर्डिंग म्हणतात,) करणार काय?
उप्क्रमाला शुभेच्छा!
उप्क्रमाला शुभेच्छा!
उप्क्रमाला शुभेच्छा!
उप्क्रमाला शुभेच्छा!
सहज आठवलं, तंजावूर मध्येही मराठी लोक बरीच वर्षे स्थायीक आहेत, त्यांची एक वेगळीच मराठी बोली आहे. फारच गोड. तिचेही नमुने गेत अहात का ? ते फार लांबही नसावे.
छान उपक्रम. शुभेच्छा. सध्या
छान उपक्रम. शुभेच्छा. सध्या काही उपयुक्त सुचवू शकत नाही याबद्दल क्षमस्व.
छान उपक्रम. शुभेच्छा.
छान उपक्रम. शुभेच्छा.
छान, स्तुत्य उपक्रम.
छान, स्तुत्य उपक्रम. शुभेच्छा तुम्हा सर्वांना.
<<त्याचाच पुढचा भाग कुडाळ,
<<त्याचाच पुढचा भाग कुडाळ, रत्नागिरी, पुणे येथे टप्प्या-टप्प्याने सुरु करत आहोत. त्यानंतर आम्ही अमरावती, भंडारा, बुलढाणा, चंद्रपूर, गडचिरोली, गोंदिया, हिंगोली, जळगाव, लातूर, नांदेड, नंदूरबार, उस्मानाबाद, परभणी, सातारा, वाशिम, अहमदनगर भागातही जाणार आहोत.<<<
यात धुळे नाही काय? कारण नन्दुरबारची अहिराणीचा लहेजा जरा गुजराथीकडे झुकणारा आहे. जळगावी अहिराणीचा वेगळा आणी धुळ्याचा वेगळा.
छान उपक्रम. शुभेच्छा.
छान उपक्रम. शुभेच्छा.
सध्या महाराष्ट्रातील मराठी
सध्या महाराष्ट्रातील मराठी इतकाच पर्याय उपलब्ध आहे. या कामासाठी महाराष्ट्रात फिरुन नमुने गोळा करणे तसेही खर्चिक काम आहे. त्यात पुन्हा परदेशी जाणे म्हणजे जरा अशक्यच.
तंजावूरप्रमाणेच कारवार बेळगाव आहेच. पण वर सांगितल्याप्रमाणे सध्या महाराष्ट्राबाहेर जाणे नाही.
दोनेक संस्था यावर काम करत आहेत. कदाचित धुळेमधील काम झालं असावं. सध्या आमच्याकडे हिच यादी आहे. इथे कुणी काही सुचवू शकत असाल तर नक्की सुचवा.
असे गावोगाव फिरण्यापेक्षा
असे गावोगाव फिरण्यापेक्षा एखादे मोबाईल अँप बनवून त्याच्यावर लोकांना घरबसल्या त्यांच्या आवाज रेकॉर्ड करण्याचा मार्ग कसा वाटतो? अर्थात तुम्ही या पर्यायाचा विचार केला असेलच म्हणा. पण तो पर्याय का नाकारला याचे कुतूहल आहे.
गोव्यात पण एकदम मस्त मराठी
गोव्यात पण एकदम मस्त मराठी बोलतात. एवढ्यातच इन्स्टा वर ऐकले. खूप गोड वाटली मराठी.
कोल्हापूर?
कोल्हापूर?
सर्वांचे आभार.
सर्वांचे आभार.
@नन्द्या७५, परदेशात स्थायिक असणारे लोक इथूनच तिकडे गेलेले असल्यामुळे त्यांच्या मूळ भागात जी रेकॉर्डिंग्ज होतील, त्यात त्यांचे लहजे आपोआप कव्हर होतील.
@माबो वाचक, मोबाईल अॅपवरच रेकॉर्ड करुन घेणे चालू आहे. समोर बसून करून घेण्यामागे अनेक कारणे आहेत. भरपूर प्रश्नावल्या तयार केल्या आहेत. ज्या स्वरुपाची आणि ज्या भागातील व्यक्ती असेल त्यानुसार प्रश्न विचारले जातात. आपल्याला लहजांबरोबरच विविध प्रकारचा आणि विशिष्ट, असे दोन्ही शब्दसंग्रह देखिल गोळा करायचे आहेत आणि ते विविध आवाजांमध्ये आणि विविध वयोगटांचे घ्यायचे असल्याने ते साधले जातेय हे पाहणे प्रत्यक्ष करून घेण्यातच शक्य होते. अनावश्यक पुनरावृत्ती किंवा अडखळणे टाळणे, वक्त्याला आश्वस्त करणे, गरज भासल्यास काही मार्गदर्शन करणे या बाबी परोक्ष शक्य होणार नाहीत. मागचे आवाज, गोंगाट येणार नाहीत, आवश्यक ठराविक कालावधी पूर्ण होईल याची दक्षता घ्यावी लागते. खरोखरच वेगवेगळी माणसे बोलत आहेत, फसवणूक होत नाही ना, याची खतरजमा केवळ प्रत्यक्ष हजर राहूनच शक्य आहे.
आपल्याकडे काम कसेतरी उरकण्याचे, पाट्या टाकण्याचे कसब असते. या वृत्तीमुळे सुरुवातीच्या ध्वनीमुद्रणांमध्ये रिजेक्शनचा दर प्रचंड होता, जो परवडणारा नाही. शिवाय करंज्या करताना जशा शेवटपर्यंत शेपट्या निघत राहतात तसे इथेही होते आणि संशोधन प्रकल्प असल्यामुळे त्या इश्शूजचे निरसन होऊन रिजेक्शन शून्य होईल हा कटाक्ष केवळ प्रत्यक्ष काम करून घेणारे लोकच ठेवू शकतात.
सगळ्याच जिल्ह्यांमध्ये हा उपक्रम होणार आहे, सगळ्या जिल्ह्यांचा उल्लेख केल्यास विनाकारण पोस्ट लांबली असती.
तंजावूर, कारवार, बेळगाव, गोवा, इंदूर, ग्वाल्हेर अशा महाराष्ट्राबाहेरील मराठी भाषा बहुल ठिकाणी त्या त्या मूळ भाषांच्या ध्वनिमुद्रणांच्या वेळी मराठीचे नमुने देखिल गोळा केले जाणार आहेत.
कौतुकने उल्लेख केल्याप्रमाणे आर्थिक गणिते जिकीरीची आहेत, तो ताळमेळ घालत काम पुढे नेणे सुरू आहे.
कृपया तुमच्या सूचना, शंका जरूर येऊ द्या, आम्ही त्या कशा पद्धतीने विचारात घेता येतील ते अवश्य पाहू. आमच्या नजरेतून निसटलेले मुद्दे आले तर तीसुद्धा मदत ठरेल.
धन्यवाद
उत्तम प्रकल्प आहे.
उत्तम प्रकल्प आहे.
तरुण जनतेचे लहजे अवश्य घ्या असे सुचवीन. फार फरक आहे
तरुणांच्या आणि प्रौढांच्या भाषेत / उच्चारणात !
पुढे निष्कर्ष काय निघाले याबद्दल वाचायला आवडेल.
अनेकानेक शुभेच्छा
वा! मस्त उपक्रम. मदत करायला
वा! मस्त उपक्रम. शुभेच्छा!
नमस्कार !!
नमस्कार !!
AI4भारत मध्ये तुमचे स्वागत आहे !
AI4Bharat ही IIT मद्रासमधील एक रिसर्च लॅब आहे जी भारतीय भाषांसाठी ओपन सोर्स डेटासेट, टूल्स, मॉडेल आणि एप्लिकेशन्स विकसित करण्यावर काम करत आहे. गेल्या वर्षभरापासून, आम्ही आपल्या संविधानात नमूद असलेल्या २२ भाषांसाठी संपूर्ण भारतातून स्पीच डेटा (नेटिव्ह स्पीकर्स रेकॉर्डिंग) म्हणजेच बोलीभाषेतील संवादाचे रेकॉर्डिंग गोळा करत आहोत. इलेक्ट्रॉनिक्स आणि माहिती तंत्रज्ञान मंत्रालयाच्या भाषिणी प्रकल्पांतर्गत, आम्ही मूळ मराठी भाषिक लोकांच्या आवाजाचे नमुने गोळा करण्यासाठी वेगवेगळ्या जिल्ह्यांमध्ये एक कार्यक्रम आयोजित करतो, ज्यामध्ये आम्ही स्थानिक लोकांचे आवाज त्यांच्याच मोबाईलमधील एका एपमधे रेकॉर्ड करतो. विदर्भ, रायगड, मुंबई आणि सिंधूदुर्ग जिल्ह्यामधून आम्ही यशस्वीपणे डेटा गोळा केला आहे. आता पुणे येथे येत्या 29 जूनपासून 10 जुलैपर्यंत हा कार्यक्रम आयोजित केला जाणार आहे. पुणे एसएनडीटी येथे रेकॉर्डिंग केलं जाणार आहे. सर्वांनी यात सहभागी व्हावे ही नम्र विनंती !
कौतुकाची थाप म्हणून, रेकॉर्ड केलेल्या माहितीची गुणवत्ता चाचणी पूर्ण झाल्यानंतर प्रत्येक स्वीकारलेल्या सहभागी व्यक्तीला त्यांच्या बँक खात्यात 500/- रुपयांचे मानधन दिले जाईल.
कृपया लक्षात घ्या की आम्ही या कार्यक्रमासाठी एका जिल्ह्यातील फक्त 150 ते 200 लोकांनाच आमंत्रित करू शकतो. तुमचा आवाज मराठीत नोंदवण्यासाठी खालील नंबरवर संपर्क साधा.
आमच्याबद्दल आणखी जाणून घेण्यासाठी आमच्या संकेतस्थळाला भेट द्या: https://ai4bharat.iitm.ac.in/
प्रतिनिधी संपर्क क्रमांक: कौतुक शिरोडकर - 9834875172, मकरंद सामंत 9404259250, निनाद खाडिलकर 9404431255, सिद्धेश कदम 7798797263 गौरी काळे 9657207792
विशेष सूचना:-
१. अर्जदार 18 वर्षांपेक्षा जास्त वयाचा असावा.
२. रेकॉर्डिंगसाठीचा मजकूर मराठीत असेल.
३. येताना आपले आधार कार्ड सोबत ठेवावे.
४. तुमचा व्यवस्थित चार्ज केलेला फोन (Android किंवा सामान्य फोन ) येताना सोबत घेऊन यावा. आयफोन या
कामासाठी उपयुक्त नाही.
५. रेकॉर्डिंग पूर्ण करण्यासाठी एका सहभागीस सुमारे 2.00 ते 2.30 तासाचा कालावधी लागतो.
धन्यवाद,
AI4Bharat Team