રચના, કોલેજો અને યુનિવર્સિટીઓ
કૉર્પસ ભાષાશાસ્ત્ર શું છે?
માત્ર થોડા દાયકા પહેલા ભાષાકીય સંશોધન આપોઆપ, વૈજ્ઞાનિકો માત્ર સ્વપ્ન શકે છે. કામ હાથ દ્વારા કરવામાં આવી હતી, તે વિદ્યાર્થીઓ મોટી સંખ્યામાં આકર્ષે છે, ત્યાં એક નોંધપાત્ર શક્યતા "કેરલેસ" ભૂલો, અને સૌથી અગત્યનું - આ બધા લાંબા, લાંબા સમય લીધો હતો.
કમ્પ્યુટર ટેકનોલોજીના વિકાસ આજે ઝડપી તીવ્રતા ક્રમ પર સંશોધન હાથ ધરવા માટે શક્ય બન્યું છે, અને ભાષાના અભ્યાસ સૌથી આશાસ્પદ દિશાઓ એક કોર્પસ ભાષાશાસ્ત્ર છે. તેના મુખ્ય લક્ષણ એક ડેટાબેઝ માં લખાણ માહિતી, માહિતી મોટા પ્રમાણમાં ઉપયોગ કરે છે, એક ખાસ રીતે કરે છે અને નોંધપાત્ર શરીર કહેવાય છે.
તારીખ કરવા માટે, ત્યાં ઘણા વિવિધ ભાષાકીય સામગ્રી લાખો લેક્સિકલ યુનિટ્સ અબજો સેંકડો આવરતું આધારે અલગ હેતુઓ સાથે બનાવવામાં ઇમારતો છે. આ દિશામાં એક આશાસ્પદ તરીકે ઓળખવામાં આવે છે અને એપ્લિકેશન અને સંશોધન હેતુ તરફ નોંધપાત્ર પ્રગતિ દર્શાવે છે. નિષ્ણાતો, એક રીતે અથવા કુદરતી ભાષા સાથે બીજી વ્યવહાર, તે ઓછામાં ઓછા એક મૂળભૂત સ્તરે પાઠો શરીરની સાથે પરિચિત કરવા માટે ભલામણ કરવામાં આવે છે.
કોર્પસ ભાષાશાસ્ત્ર ધ હિસ્ટ્રી ઓફ
આ ટ્રેન્ડ રચના છેલ્લા સદીના પ્રારંભમાં 60-IES બ્રાઉન શરીર પર યુનાઈટેડ સ્ટેટ્સ બનાવટ કારણે છે. સંગ્રહ શબ્દ સ્વરૂપો બધા 1 મિલિયન પાઠો સમાવેશ થાય છે, અને આજે આ કદની શરીર તદ્દન અસ્પર્ધાત્મક હશે. આ મોટે ભાગે કોમ્પ્યુટર ટેકનોલોજીના વિકાસ ગતિ, તેમજ નવા સંશોધન સાધનો વતી જતી માગને કારણે છે.
90 કોર્પસ ભાષાશાસ્ત્ર સંપૂર્ણ અને સ્વતંત્ર શિસ્ત કે ઉભરી માં, ગ્રંથો એક સંગ્રહ દોરવામાં અને ભાષાઓ ડઝનેક માટે ચિહ્નિત કરવામાં આવી છે. આ સમયગાળા દરમિયાન તે બનાવવામાં આવી હતી, ઉદાહરણ તરીકે, બ્રિટીશ નેશનલ કૉર્પસ 100 મિલિયન ટોકન્સ.
ભાષાશાસ્ત્રના આ વિસ્તારમાં વિકાસ સાથે, લખાણ વોલ્યુમો વધુ અને વધુ બની રહી છે (અને શબ્દકોશ એકમો અબજો સુધી પહોંચવા), અને લેઆઉટ વધુ વૈવિધ્યસભર બની રહ્યું છે. તારીખ કરવા માટે, ઈન્ટરનેટ જગ્યા લખવામાં મડદા જોવા મળે છે અને ભાષા, બહુભાષી, અને શિક્ષણ લક્ષી કલાત્મક અથવા શૈક્ષણિક સાહિત્યમાં, તેમજ અન્ય અનેક જાતોમાં બોલાય શકાય છે.
હાઉસિંગ શું છે
શરીર ભાષાશાસ્ત્રમાં શરીર પ્રકારો કેટલાક કારણોસર પૂરી પાડવામાં આવી શકે છે. તર્ક, વર્ગીકરણ માટે આધાર લખાણ ભાષા (રશિયન, જર્મન), ઍક્સેસ મોડ (ઓપન સોર્સ, બંધ વ્યાપારિક), સ્રોત સામગ્રી (સાહિત્ય, દસ્તાવેજી, શૈક્ષણિક, પત્રકારત્વ) પ્રકારમાં હોઈ શકે છે.
રસપ્રદ રીતે બોલાતી ભાષા માલના પેદા કરે છે. ત્યારથી આવા વાણી ઇરાદાપૂર્વકની રેકોર્ડિંગ ઉત્તરદાતાઓ માટે કૃત્રિમ પર્યાવરણ બનાવવા માટે, અને પરિણામી સામગ્રી "સ્વયંભૂ" કહેવાય કરી શકાઈ નથી, આધુનિક કોર્પસ ભાષાશાસ્ત્ર અન્ય રીતે ગયો. એક સ્વયંસેવક માઇક્રોફોન સાથે સજ્જ છે, અને દિવસ દરમિયાન તમામ વાતચીતો છે, જેમાં તેને ભાગ એક રેકોર્ડ ઉત્પાદન કર્યું હતું. લોકો આસપાસ, અલબત્ત, ખબર નથી શકે છે રોજિંદા વાતચીત દરમિયાન વિજ્ઞાન વિકાસ માટે ફાળો આપે છે છે.
બાદમાં ડેટાબેઝમાં સંગ્રહિત રેકોર્ડ પ્રાપ્ત થઈ છે અને પ્રિન્ટેડ ટેક્સ્ટ ટ્રાન્સક્રિપ્ટ પ્રકાર સાથે આવે છે. આમ, તે શક્ય માર્કઅપ મૌખિક દૈનિક ભાષણ હાઉસિંગ બનાવવા માટે જરૂરી બની જાય છે.
અરજી
શક્ય હોય ત્યાં ભાષાના ઉપયોગ, અને કદાચ ઇમારતો પાઠો ઉપયોગ. પદ્ધતિઓ ભાષાશાસ્ત્રમાં હલ લાગુ કરવા હોઈ શકે છે:
- એક કાર્યક્રમ કી નક્કી બનાવી, વ્યાપક રાજકારણ અને બિઝનેસ માટે વપરાય છે અનુક્રમે મતદારો અને ગ્રાહકો હકારાત્મક અને નકારાત્મક પ્રતિભાવો ટ્રેક રાખવા.
- શબ્દકોશો અને અનુવાદકો કનેક્શન માહિતી સિસ્ટમ તેમના પ્રભાવ સુધારવા માટે.
- સંશોધન કાર્યો કે ભાષા એકમ, તેના વિકાસ અને નજીકના ભવિષ્યમાં ફેરફારો આગાહી ઇતિહાસ સમજણમાં ફાળો વિવિધ.
- માહિતી પુનઃપ્રાપ્તિ સિસ્ટમો વિકાસ મોર્ફોલોજિકલ વાકયરચનામાં, સિમેન્ટીક અને અન્ય સુવિધાઓ પર આધારિત છે.
- વિવિધ ભાષાકીય સિસ્ટમો અને અન્ય ઓપ્ટિમાઇઝેશન.
ઇમારતો ઉપયોગ
એક લાક્ષણિક શોધ એન્જિન સાથે સમાન સાધન ઈન્ટરફેસ, અને વપરાશકર્તા માહિતી બેઝ શોધવા માટે એક શબ્દ અથવા શબ્દો સંયોજન દાખલ કરવા માટે પૂછે છે. ની રચના ચોક્કસ ક્વેરી ઉન્નત આવૃત્તિ છે, કે જે વર્ચ્યુઅલ કોઈપણ ભાષાકીય માપદંડ પર શાબ્દિક માહિતી શોધવા માટે પરવાનગી આપે છે ઉપયોગ કરી શકો છો.
શોધ આધાર હોઈ શકે છે:
- વાણી ભાગો ચોક્કસ જૂથ સભ્યપદ;
- વ્યાકરણીય લાક્ષણિકતાઓ;
- સીમેન્ટિક્સ;
- શૈલીયુક્ત અને લાગણીશીલ રંગ.
તમે પણ ઉદાહરણ તરીકે, શબ્દો ક્રમ માટે શોધ માપદંડ ભેગા કરી શકો છો, હાજર તંગ, પ્રથમ પુરુષ એકવચન છે, કે જે નામયોગી અવ્યય "માં" અને દ્વિતીયા કેસ સંજ્ઞા પછી આવે માં ક્રિયાપદ બધા વારાઓને શોધો. આવા સરળ કાર્ય ઉકેલ વપરાશકર્તા થોડા સેકન્ડ લાગે છે અને સ્પષ્ટ ક્ષેત્રોમાં માત્ર થોડા માઉસ ક્લિક્સ જરૂરી છે.
બનાવવાની પ્રક્રિયા
શોધ પોતે બધા subcorpus પર હાથ ધરી શકાય અને એક ખાસ રીતે, પસંદ ખાસ ધ્યેય હાંસલ કરવામાં જરૂરિયાતો પર આધાર રાખીને:
- પ્રથમ પગલું વ્યાખ્યાયિત કરવા માટે કે જે ગ્રંથો કેસ માટે આધાર રચે છે. વ્યવહારુ હેતુ માટે, તે વારંવાર પત્રકારત્વની, સમાચાર કથાઓ, ઓનલાઇન ટિપ્પણીઓ વપરાય છે. સંશોધન પ્રોજેક્ટ પેકેજ પ્રકારના વિશાળ વિવિધતા ઉપયોગ છે, પરંતુ લખાણ અમુક સામાન્ય જમીન અનુસાર પસંદ કરવી જોઇએ.
- pretreatment આધિન પાઠો પરિણમે સંગ્રહ, ત્યાં ભૂલો કરેક્શન લખાણ ગ્રંથસૂચિ અને વધારાની-ભાષાકીય વર્ણન તૈયાર કરવામાં આવે છે, જો કોઈ હોય.
- દૂર થાય છે બધા બિન-શાબ્દિક માહિતી ગ્રાફિક્સ, ચિત્રો, કોષ્ટકો સાફ કરે છે.
- ટોકન્સ, જે ખાસ કરીને વાણી છે, વધુ પ્રક્રિયા માટે એક ફાળવણી છે.
- છેલ્લે, તે તત્વો, શબ્દરૂપાત્મક syntactical અને અન્ય નિશાનો મેળવી બહુમતી ધરવામાં.
તેમાં વિતરિત તત્વો છે, જે પ્રત્યેક વાણી, વ્યાકરણના ભાગ ઓળખવામાં આવે છે અને કેટલાક કિસ્સાઓમાં, સિમેન્ટીક ગુણધર્મોને માં, બહુમતી સાથે વાકયરચનામાં માળખું દ્વારા બનાવાયેલી તમામ વ્યવહારો પરિણામ.
ઇમારતો બનાવવામાં મુશ્કેલીઓના
તે સમજવા માટે છે જે શરીરને માટે એકસાથે શબ્દો અથવા વાક્યો સમૂહ મૂકી પૂરતી નથી મહત્વપૂર્ણ છે. એક તરફ, ગ્રંથો એક સંગ્રહ સંતુલિત હોવી જોઈએ, એટલે કે, ચોક્કસ પ્રમાણમાં પાઠો વિવિધ પ્રકારના પ્રતિનિધિત્વ કરે છે. બીજી બાજુ - બિડાણ સમાવિષ્ટો એક ખાસ રીતે મળવું જોઈએ.
પ્રથમ સમસ્યા એક કરાર દ્વારા ઉકેલી છે: ઉદાહરણ તરીકે, સંગ્રહ સાહિત્યિક પાઠો 60%, દસ્તાવેજી 20% સમાવેશ થાય છે, એક ચોક્કસ ટકાવારી બોલાતી ભાષા, કાયદા વૈજ્ઞાનિક કાર્યો, વગેરે સંપૂર્ણ રેસીપી સંતુલિત શરીર આજે અસ્તિત્વમાં નથી લેખિત રજૂઆત આપવામાં આવે છે ...
બીજા પ્રશ્ન, સામગ્રી લેઆઉટ વિષે, પડકારરૂપ ઉકેલવા. ત્યાં ખાસ કાર્યક્રમો અને સ્વયંસંચાલિત લખાણો નિશાન માટે વપરાય ગાણિતીક નિયમો હોય છે, પરંતુ તેઓ એક આદર્શ પરિણામ આપતા નથી અટકાવો કારણ બની શકે છે અને જાતે પુનઃકાર્ય જરૂરી છે. તકો અને આ સમસ્યા સાથે વ્યવહાર પડકારો એક પેપર કોર્પસ ભાષાશાસ્ત્રના વી પી Zaharova વિગતવાર વર્ણવામાં આવે છે.
લખાણ માર્કઅપ કેટલાક સ્તરો છે, કે જે અમે નીચે યાદી પર લાગુ પાડવામાં આવે છે.
મોર્ફોલોજિકલ ટેગિંગ
શાળા, અમે યાદ રાખો કે રશિયન ભાષામાં, ત્યાં ભાષણ વિવિધ ભાગો હોય છે, અને તેમને દરેક તેના પોતાના લાક્ષણિકતાઓ ધરાવે છે. ઉદાહરણ તરીકે, ક્રિયાપદ ઝોક શ્રેણીઓ અને ક્યા સમયે જે કોઈ સંજ્ઞા છે. વગર ખચકાટ વતની સ્પીકર સંજ્ઞાઓ અને અનુબદ્ધ ક્રિયાપદો ઘટાડો છે, પરંતુ 100 મિલિયન શરીર માર્ક. મજૂર કામ કરશે નહિં ટોકન્સ. બધા જરૂરી કામગીરી કોમ્પ્યુટર અમલ કરી શકો છો તેમ છતાં, આ માટે તે શીખવવામાં કરવાની જરૂર છે.
મોર્ફોલોજિકલ ટેગિંગ, કોમ્પ્યુટર ચોક્કસ વ્યાકરણીય લાક્ષણિકતાઓ કર્યા વાણી ચોક્કસ ભાગ તરીકે દરેક શબ્દ "સમજવા" જ જોઈએ. ત્યારથી રશિયન (અને કોઈપણ અન્ય ભાષા) નિયમિત નિયમો સંખ્યાબંધ કામ કરે છે, તે મોર્ફોલોજિકલ વિશ્લેષણ માટે ઓટોમેટિક પ્રક્રિયા બિલ્ડ, ગાણિતીક નિયમો સંખ્યાબંધ કાર રોકાણ શક્ય છે. જો કે, નિયમ, તેમજ વિવિધ જટીલ પરિબળો અપવાદો છે. પરિણામે, આજે નેટ કોમ્પ્યુટર વિશ્લેષણ 100 મિલિયન. યુનિટ્સની શરીર પર શબ્દો, જાતે પુનઃકાર્ય જરૂરી અત્યાર સુધી આદર્શ છે, અને તે પણ 4% ભૂલ 4 મિલિયન મૂલ્ય પ્રાપ્ત કરે છે..
વિગતવાર પુસ્તક સમસ્યા Zaharova વી પી "કોર્પસ ભાષાશાસ્ત્ર" વર્ણવે છે.
વાકયરચનામાં એનોટેશન
વિષ્લેશણ અથવા વિશ્લેષિત - એક પ્રક્રિયા કે જે સજા શબ્દો સંબંધ નક્કી કરે છે. ગાણિતીક નિયમો સમૂહ મદદથી વિષય, વિશેષણો, ઉમેરાઓ, વાણી બહુવિધ વળે લખાણ નક્કી કરવાનું શક્ય છે. શોધવા માટે જે શબ્દો મુખ્ય અનુક્રમમાં છે, અને છે - આશ્રિત, અમે અસરકારક રીતે લખાણ પાસેથી માહિતી બહાર કાઢી શકો છો અને શોધ માંગનાં પ્રતિસાદરૂપે ફક્ત માહિતી રસપ્રદ ઇશ્યૂ કરવા મશીન શીખવે છે.
માર્ગ દ્વારા, આધુનિક શોધ એન્જિન ઉપયોગ જેમ કે સંબંધિત ક્વેરીઝ જવાબમાં લાંબી પાઠો બદલે ચોક્કસ નંબરો આપવા અથવા "કેટલા કેલરી એક સફરજન માં" "સેન્ટ પીટર્સબર્ગ મૉસ્કો થી અંતર." જોકે, પ્રક્રિયા અથવા અન્ય મૂળભૂત ટ્યુટોરીયલ "કોર્પસ ભાષાશાસ્ત્ર પરિચય" સંપર્ક કરવાની જરૂર દ્વારા વર્ણવવામાં પણ બેઝિક્સ સમજવા માટે.
સિમેન્ટીક માર્કઅપ
શબ્દ સીમેન્ટિક્સ - સરળ શબ્દો, અર્થ છે. એક શબ્દ એટ્રિબ્યુશન ટેગ્સ અર્થપૂર્ણ વિશ્લેષણ, તેના સિમેન્ટીક વર્ગો અને ઉપકેટેગરીઝ સમૂહ સાથે જોડાયેલા પ્રતિબિંબ માટે વ્યાપકપણે લાગુ અભિગમ. આવા માહિતી એલ્ગોરિધમ્સ લખાણ સ્વર, આપોઆપ કેન્દ્રિત સંક્ષિપ્તીકરણ અને કોર્પસ ભાષાશાસ્ત્ર અન્ય કાર્યો પદ્ધતિઓ વિશ્લેષણ આશાવાદી માટે મૂલ્યવાન છે.
વૃક્ષની "રૂટ", એક નંબર એક ખૂબ વિશાળ સીમેન્ટિક્સ સાથે અમૂર્ત શબ્દ રજૂ કરે છે. વૃક્ષ ગાંઠો શાખા તરીકે આકાર લે છે, વધુ અને વધુ ચોક્કસ શાબ્દિક તત્વો સમાવેશ થાય છે. ઉદાહરણ તરીકે, શબ્દ "પ્રાણી" "માનવ" અને "પ્રાણી" જેવા ખ્યાલો સાથે સંકળાયેલ હોઈ શકે છે. વર્ગો અને પ્રાણીઓ પ્રકારો પર - પ્રથમ શબ્દ વિવિધ વ્યવસાયો, સગપણ શરતો, રાષ્ટ્રીયતા, અને બીજા માં નવા નવા ઉદ્યોગો માટે ચાલુ રહેશે.
માહિતી પુનઃપ્રાપ્તિ સિસ્ટમો ઉપયોગ
કોર્પસ ભાષાશાસ્ત્ર ઉપયોગ વિસ્તારો પ્રવૃત્તિ વિવિધ ક્ષેત્રોમાં આવરી લે છે. હાઉજિંગ તૈયારી અને શબ્દકોશો કરેક્શન માટે વાપરવામાં આવે છે, સ્વયંસંચાલિત અનુવાદ સિસ્ટમો, નોંધો તથ્યો પુનઃપ્રાપ્ત, સ્વર અને અન્ય ટેક્સ્ટ પ્રક્રિયા નક્કી બનાવો.
વધુમાં, જેમ કે સાધનો સક્રિય વિશ્વ ભાષાઓ અને સામાન્ય રીતે ભાષા કામ વ્યવસ્થાતંત્રની અભ્યાસમાં ઉપયોગ થાય છે. પૂર્વ તૈયાર માહિતી મોટા પ્રમાણમાં ઍક્સેસ વિકાસ ભાષાઓ વલણો ઝડપી અને વ્યાપક અભ્યાસ કરે છે, અને સ્થિર રચના નવા શબ્દોને ભાષણ ઝડપ ફેરફાર લેક્સિકલ યુનિટ્સ અને અન્ય મૂલ્યવાન માને છે.
ડેટા આવા મોટા પ્રમાણમાં સાથે કામ ઓટોમેશન જરૂર છે, આજે ત્યાં કમ્પ્યુટર અને કોર્પસ ભાષાશાસ્ત્ર વચ્ચે બંધ આદાનપ્રદાન છે.
રશિયન રાષ્ટ્રીય કોર્પસ
આ કેસ (સંક્ષિપ્ત NKRYA) subcorpus સંખ્યાબંધ કાર્યો વિશાળ વિવિધતા માટે એક સ્રોત ઉપયોગ માટે પરવાનગી આપે છે સમાવેશ થાય છે.
ડેટાબેઝમાં સામગ્રી NKRYA વિભાજિત કરવામાં આવે છેઃ
- મીડિયા '90 અને 2000, બંને સ્થાનિક અને વિદેશી પ્રકાશનની માટે;
- વાણી રેકોર્ડિંગ;
- aktsentologicheski ચિહ્નિત ગ્રંથો (દા.ત., તણાવ ગુણ);
- બોલી વાણી;
- કવિતા;
- વાકયરચનામાં અને અન્ય નિશાનો સાથે મટિરીયલ્સ.
માહિતી સિસ્ટમ પણ કે ઇંગલિશ, જર્મન, ફ્રેન્ચ અને અન્ય ઘણી ભાષાઓમાં (અને ઊલટું) રશિયન થી કામો સમાંતર અનુવાદ સાથે Subcorpus સમાવેશ થાય છે.
પણ ડેટાબેઝમાં ત્યાં ઐતિહાસિક લખાણો એક વિભાગ, તેના વિકાસ વિવિધ ગાળાઓ માં રશિયન લખવામાં ભાષણ રજૂ કરે છે. ત્યાં પણ એક તાલીમ સંસ્થા, જે રશિયન ભાષા નિપુણતા વિદેશી નાગરિકો માટે ઉપયોગી હોઈ શકે છે.
રશિયન રાષ્ટ્રીય કૉર્પસ 400 મિલિયન લેક્સિકલ યુનિટ્સ ધરાવે છે, અને યુરોપમાં સંસ્થાઓ ભાષાઓ નોંધપાત્ર ભાગ આગળ ઘણા માર્ગો છે.
ભવિષ્ય
આ ટ્રેન્ડ માન્યતા તરફેણમાં ફેક્ટ રશિયન યુનિવર્સિટીઓમાં પ્રયોગશાળા કોર્પસ ભાષાશાસ્ત્ર આશાસ્પદ, વિદેશી તેમજ ઉપલબ્ધતા છે. આ માહિતી અને શોધ સ્રોતોની માળખામાં ઉપયોગ અને સંશોધન સાથે ઉચ્ચ ટેકનોલોજી, પ્રશ્ન જવાબ સિસ્ટમો ક્ષેત્રમાં અમુક ચોક્કસ વિસ્તારોમાં વિકાસ આવે છે, પરંતુ તે ઉપર ચર્ચા કરવામાં આવે છે.
કોર્પસ ભાષાશાસ્ત્ર વધુ વિકાસ માટે તમામ સ્તરે અનુમાન કરવામાં આવે છે, ટેકનિકલ અને નવા ગાણિતીક નિયમો છે કે જે શોધ અને પ્રક્રિયા માહિતી, કમ્પ્યુટર્સ સત્તા પ્રક્રિયા ઑપ્ટિમાઇઝ, વધુ RAM અમલીકરણ દ્રષ્ટિએ, અને ગ્રાહક સુધીના, કારણ કે વપરાશકર્તાઓ તેમના દૈનિક સંસાધન આ પ્રકારના વાપરવા માટે વધુ અને વધુ માર્ગો છે જીવન અને કામ કરે છે.
નિષ્કર્ષ માં
2017 માં છેલ્લા સદીના મધ્યમાં, દૂરના ભવિષ્યમાં લાગતું જ્યાં spaceships બ્રહ્માંડ મારફતે મુસાફરી અને રોબોટ્સ લોકો માટે બધા કામ કરે છે. હકીકતમાં, વિજ્ઞાન "સફેદ સ્પોટ" અને ખલેલ સદીઓ માટે માનવજાત પ્રશ્નોના જવાબ આપવા માટે મરણિયા પ્રયાસો કર્યા ભરપૂર છે. ભાષાની કાર્યરત પ્રશ્નો અહીં સન્માન સ્થળ ફાળવી અને મંત્રી મંડળ તથા કોમ્પ્યુટેશનલ ભાષાશાસ્ત્ર તેમને જવાબ આપવા માટે અમને મદદ કરી શકે.
મોટા ડેટા સેટ પ્રોસેસીંગ પેટર્ન અગાઉ અપ્રાપ્ય શોધી શકો છો, વિશિષ્ટ ભાષા લક્ષણો વિકાસ આગાહી લગભગ વાસ્તવિક સમય માં શબ્દો રચના ટ્રેક કરવા માટે.
વ્યવહારુ સ્તર પર, વૈશ્વિક ઘેરી, જોઈ શકાય છે, ઉદાહરણ તરીકે, જાહેર મૂડ આકારણી સંભવિત સાધન તરીકે - ઇન્ટરનેટ વાસ્તવિક વપરાશકર્તાઓ દ્વારા બનાવેલ એક સતત ઉમેરાતી દૈનિક ધોરણે વિવિધ ગ્રંથો છે: આ ટિપ્પણીઓ અને સમીક્ષાઓ અને લેખો અને વાણી અન્ય ઘણા રચાય છે.
વધુમાં, સંસ્થાઓ સાથે કામ સમાન હાર્ડવેર, ત્યારે તે માહિતી પુનઃપ્રાપ્તિ સામેલ છે વિકાસ માટે ફાળો આપે છે, અમે સેવા "Google" અથવા "યાન્ડેક્ષ", મશીન અનુવાદ, ઇલેક્ટ્રોનિક શબ્દકોશો સાથે પરિચિત હોય છે.
અમે વિશ્વાસપૂર્વક મૂકતા કરી શકો છો કે જે કોર્પસ ભાષાશાસ્ત્ર માત્ર પ્રથમ પગલાંઓ બનાવે છે, અને નજીકના ભવિષ્યમાં ખીલી આવશે.
Similar articles
Trending Now