મોટી માત્રામાં ડેટા પર પ્રક્રિયા કરવા માટેની પદ્ધતિઓ. બિગ ડેટા ટેક્નોલોજી શહેરોના વિકાસમાં કેવી રીતે મદદ કરે છે

ફક્ત આળસુ લોકો જ મોટા ડેટા વિશે વાત કરતા નથી, પરંતુ તેઓ ભાગ્યે જ સમજી શકે છે કે તે શું છે અને તે કેવી રીતે કાર્ય કરે છે. ચાલો સૌથી સરળ વસ્તુથી શરૂ કરીએ - પરિભાષા. રશિયનમાં બોલતા, બિગ ડેટા એ ચોક્કસ કાર્યો અને હેતુઓ માટે તેનો ઉપયોગ કરવા માટે સંરચિત અને અસંગઠિત બંને ડેટાની પ્રક્રિયા કરવા માટેના વિવિધ સાધનો, અભિગમો અને પદ્ધતિઓ છે.

અનસ્ટ્રક્ચર્ડ ડેટા એવી માહિતી છે જેનું પૂર્વનિર્ધારિત માળખું નથી અથવા ચોક્કસ ક્રમમાં ગોઠવાયેલ નથી.

નેચર મેગેઝિનના એડિટર ક્લિફોર્ડ લિંચ દ્વારા 2008માં વિશ્વની માહિતીના જથ્થામાં વિસ્ફોટક વૃદ્ધિને સમર્પિત વિશેષ અંકમાં "બિગ ડેટા" શબ્દ રજૂ કરવામાં આવ્યો હતો. જોકે, અલબત્ત, મોટો ડેટા પોતે પહેલા અસ્તિત્વમાં હતો. નિષ્ણાતોના મતે, બિગ ડેટા કેટેગરીમાં સૌથી વધુ ડેટા દરરોજ 100 જીબીથી વધુનો સમાવેશ થાય છે.

આ પણ વાંચો:

આજે, આ સરળ શબ્દ માત્ર બે શબ્દો છુપાવે છે - ડેટા સ્ટોરેજ અને પ્રોસેસિંગ.

મોટા ડેટા - સરળ શબ્દોમાં

આધુનિકમાં મોટી દુનિયાડેટા એ એક સામાજિક-આર્થિક ઘટના છે જે વિશાળ માત્રામાં ડેટાનું વિશ્લેષણ કરવા માટે નવી તકનીકી ક્ષમતાઓના ઉદભવ સાથે સંકળાયેલ છે.

આ પણ વાંચો:

તેને સમજવામાં સરળ બનાવવા માટે, એક સુપરમાર્કેટની કલ્પના કરો કે જેમાં તમામ માલસામાન તમે ઉપયોગમાં લેવાતા ક્રમમાં નથી. ફળની બાજુમાં બ્રેડ ટમેટાની લૂગદીસ્થિર પિઝાની નજીક, ટેમ્પોન રેકની સામે હળવા પ્રવાહી, જેમાં એવોકાડો, ટોફુ અથવા શિતાકે મશરૂમ્સ હોય છે. બિગ ડેટા દરેક વસ્તુને તેના સ્થાને મૂકે છે અને તમને અખરોટનું દૂધ શોધવામાં, કિંમત અને સમાપ્તિની તારીખ શોધવામાં મદદ કરે છે અને એ પણ - તમારા સિવાય કોણ આ દૂધ ખરીદે છે અને તે શેના માટે છે દૂધ કરતાં વધુ સારુંગાયનું

કેનેથ કુકિયર: બિગ ડેટા એ બહેતર ડેટા છે

મોટી માહિતી ટેકનોલોજી

ડેટાની વિશાળ માત્રા પર પ્રક્રિયા કરવામાં આવે છે જેથી વ્યક્તિ તેના વધુ અસરકારક ઉપયોગ માટે ચોક્કસ અને જરૂરી પરિણામો મેળવી શકે.

આ પણ વાંચો:

હકીકતમાં, બિગ ડેટા એ સમસ્યાઓનો ઉકેલ અને પરંપરાગત ડેટા મેનેજમેન્ટ સિસ્ટમનો વિકલ્પ છે.

મેકકિન્સે અનુસાર બિગ ડેટા પર લાગુ પૃથ્થકરણની તકનીકો અને પદ્ધતિઓ:

  • ક્રાઉડસોર્સિંગ;

    ડેટા મિશ્રણ અને એકીકરણ;

    મશીન લર્નિંગ;

    કૃત્રિમ ન્યુરલ નેટવર્ક્સ;

    પેટર્નની ઓળખ;

    અનુમાનિત વિશ્લેષણ;

    સિમ્યુલેશન મોડેલિંગ;

    અવકાશી વિશ્લેષણ;

    આંકડાકીય વિશ્લેષણ;

  • વિશ્લેષણાત્મક ડેટાનું વિઝ્યુલાઇઝેશન.

આડી માપનીયતા જે ડેટા પ્રોસેસિંગને સક્ષમ કરે છે તે મોટા ડેટા પ્રોસેસિંગનો મૂળભૂત સિદ્ધાંત છે. ડેટા કમ્પ્યુટિંગ નોડ્સમાં વિતરિત કરવામાં આવે છે, અને કામગીરીમાં ઘટાડો કર્યા વિના પ્રક્રિયા થાય છે. મેકકિન્સે લાગુ પડવાના સંદર્ભમાં રિલેશનલ મેનેજમેન્ટ સિસ્ટમ્સ અને બિઝનેસ ઇન્ટેલિજન્સનો પણ સમાવેશ કર્યો હતો.

ટેક્નોલોજીઓ:

  • NoSQL;
  • મેપરેડ્યુસ;
  • હડૂપ;
  • હાર્ડવેર સોલ્યુશન્સ.

આ પણ વાંચો:

મોટા ડેટા માટે, 2001 માં મેટા ગ્રુપ દ્વારા વિકસિત પરંપરાગત વ્યાખ્યાયિત લાક્ષણિકતાઓ છે, જેને "કહેવાય છે. ત્રણ વી»:

  1. વોલ્યુમ- ભૌતિક વોલ્યુમ જથ્થો.
  2. વેગ- વૃદ્ધિ દર અને પરિણામો મેળવવા માટે ઝડપી ડેટા પ્રોસેસિંગની જરૂરિયાત.
  3. વિવિધતા- એકસાથે પ્રક્રિયા કરવાની ક્ષમતા વિવિધ પ્રકારોડેટા

મોટો ડેટા: એપ્લિકેશન્સ અને તકો

પરંપરાગત સાધનો વડે વિજાતીય અને ઝડપથી પહોંચતી ડિજિટલ માહિતીની માત્રા પર પ્રક્રિયા કરવી અશક્ય છે. ડેટા વિશ્લેષણ પોતે તમને ચોક્કસ અને અગોચર પેટર્ન જોવાની મંજૂરી આપે છે જે વ્યક્તિ જોઈ શકતી નથી. આ અમને અમારા જીવનના તમામ ક્ષેત્રોને ઑપ્ટિમાઇઝ કરવાની મંજૂરી આપે છે - થી સરકાર દ્વારા નિયંત્રિતઉત્પાદન અને દૂરસંચાર માટે.

ઉદાહરણ તરીકે, કેટલીક કંપનીઓએ થોડા વર્ષો પહેલા તેમના ગ્રાહકોને છેતરપિંડીથી સુરક્ષિત કર્યા હતા, અને ક્લાયન્ટના પૈસાની કાળજી લેવી એટલે તમારા પોતાના પૈસાની કાળજી લેવી.

સુસાન એટલિગર: મોટા ડેટા વિશે શું?

મોટા ડેટા પર આધારિત ઉકેલો: Sberbank, Beeline અને અન્ય કંપનીઓ

Beeline પાસે સબ્સ્ક્રાઇબર્સ વિશે વિશાળ માત્રામાં ડેટા છે, જેનો ઉપયોગ તેઓ તેમની સાથે કામ કરવા માટે જ નહીં, પણ બાહ્ય કન્સલ્ટિંગ અથવા IPTV એનાલિટિક્સ જેવા વિશ્લેષણાત્મક ઉત્પાદનો બનાવવા માટે પણ કરે છે. Beeline ડેટાબેઝને વિભાજિત કરે છે અને ગ્રાહકોને નાણાકીય છેતરપિંડી અને વાયરસથી સુરક્ષિત કરે છે, સંગ્રહ માટે HDFS અને Apache Spark અને ડેટા પ્રોસેસિંગ માટે Rapidminer અને Python નો ઉપયોગ કરે છે.

આ પણ વાંચો:

અથવા ચાલો Sberbank ને તેમના જૂના કેસ AS SAFI સાથે યાદ કરીએ. આ એક એવી સિસ્ટમ છે જે બેંકના ગ્રાહકોને ઓળખવા અને છેતરપિંડી અટકાવવા ફોટોગ્રાફ્સનું વિશ્લેષણ કરે છે. સિસ્ટમ 2014 માં પાછી રજૂ કરવામાં આવી હતી, સિસ્ટમ ડેટાબેઝમાંથી ફોટોગ્રાફ્સની તુલના પર આધારિત છે, જે કમ્પ્યુટર વિઝનને આભારી સ્ટેન્ડ પરના વેબ કેમેરાથી મળે છે. સિસ્ટમનો આધાર બાયોમેટ્રિક પ્લેટફોર્મ છે. આને કારણે છેતરપિંડીના કેસોમાં 10 ગણો ઘટાડો થયો છે.

વિશ્વમાં મોટો ડેટા

2020 સુધીમાં, આગાહીઓ અનુસાર, માનવતા 40-44 ઝેટાબાઇટ્સ માહિતી પેદા કરશે. અને 2025 સુધીમાં તે 10 ગણો વધશે, રિપોર્ટ ધ ડેટા એજ 2025 અનુસાર, જે IDC ના વિશ્લેષકો દ્વારા તૈયાર કરવામાં આવ્યો હતો. રિપોર્ટમાં નોંધવામાં આવ્યું છે કે મોટાભાગનો ડેટા સામાન્ય ગ્રાહકોને બદલે વ્યવસાયો દ્વારા જ જનરેટ કરવામાં આવશે.

સંશોધન વિશ્લેષકો માને છે કે ડેટા એક મહત્વપૂર્ણ સંપત્તિ બની જશે, અને સુરક્ષા જીવનમાં એક મહત્વપૂર્ણ પાયો બનશે. કાર્યના લેખકોને પણ વિશ્વાસ છે કે તકનીકી આર્થિક લેન્ડસ્કેપને બદલશે, અને સરેરાશ વપરાશકર્તા દિવસમાં લગભગ 4,800 વખત કનેક્ટેડ ઉપકરણો સાથે વાતચીત કરશે.

રશિયામાં મોટા ડેટા માર્કેટ

મોટા ડેટા સામાન્ય રીતે ત્રણ સ્ત્રોતોમાંથી આવે છે:

  • ઇન્ટરનેટ (સામાજિક નેટવર્ક્સ, ફોરમ્સ, બ્લોગ્સ, મીડિયા અને અન્ય સાઇટ્સ);
  • કોર્પોરેટ દસ્તાવેજ આર્કાઇવ્સ;
  • સેન્સર, સાધનો અને અન્ય ઉપકરણોમાંથી વાંચન.

બેંકોમાં મોટો ડેટા

ઉપર વર્ણવેલ સિસ્ટમ ઉપરાંત, Sberbank ની 2014-2018 માટેની વ્યૂહરચનાનો સમાવેશ થાય છે: ગુણવત્તાયુક્ત ગ્રાહક સેવા, જોખમ સંચાલન અને ખર્ચ ઑપ્ટિમાઇઝેશન માટે સુપર ડેટાના વિશ્લેષણના મહત્વ વિશે વાત કરે છે. હવે બેંક જોખમોનું સંચાલન કરવા, છેતરપિંડીનો સામનો કરવા, સેગમેન્ટ કરવા અને ગ્રાહકોની ક્રેડિટ યોગ્યતાનું મૂલ્યાંકન કરવા, કર્મચારીઓનું સંચાલન, શાખાઓમાં કતારોની આગાહી કરવા, કર્મચારીઓ માટે બોનસની ગણતરી કરવા અને અન્ય કાર્યો માટે બિગ ડેટાનો ઉપયોગ કરે છે.

VTB24 ગ્રાહકોના આઉટફ્લોને સેગમેન્ટ કરવા અને મેનેજ કરવા, નાણાકીય રિપોર્ટિંગ જનરેટ કરવા અને સામાજિક નેટવર્ક્સ અને ફોરમ પર સમીક્ષાઓનું વિશ્લેષણ કરવા માટે મોટા ડેટાનો ઉપયોગ કરે છે. આ કરવા માટે, તે ટેરાડેટા, SAS વિઝ્યુઅલ એનાલિટિક્સ અને SAS માર્કેટિંગ ઑપ્ટિમાઇઝરમાંથી ઉકેલોનો ઉપયોગ કરે છે.

ડેટા વૃદ્ધિનો સતત પ્રવેગ એ આધુનિક વાસ્તવિકતાઓનું અભિન્ન તત્વ છે. સામાજિક મીડિયા, મોબાઇલ ઉપકરણો, માપન ઉપકરણોમાંથી ડેટા, વ્યવસાય માહિતી - આ માત્ર કેટલાક પ્રકારના સ્ત્રોતો છે જે વિશાળ માત્રામાં ડેટા જનરેટ કરી શકે છે.

હાલમાં, બિગ ડેટા શબ્દ એકદમ સામાન્ય બની ગયો છે. મોટા પ્રમાણમાં ડેટાની પ્રક્રિયા કરવા માટેની તકનીકો સમાજના સૌથી વધુ વૈવિધ્યસભર પાસાઓને કેટલી ઝડપથી અને ઊંડી રીતે બદલી રહી છે તે વિશે દરેક જણ હજુ પણ વાકેફ નથી. વિવિધ ક્ષેત્રોમાં પરિવર્તનો થઈ રહ્યા છે, જે ક્ષેત્ર સહિત નવી સમસ્યાઓ અને પડકારોને જન્મ આપે છે માહિતી સુરક્ષા, જ્યાં તેના સૌથી મહત્વપૂર્ણ પાસાઓ જેમ કે ગોપનીયતા, અખંડિતતા, ઉપલબ્ધતા વગેરે અગ્રભાગમાં હોવા જોઈએ.

કમનસીબે, ઘણી આધુનિક કંપનીઓ તેમના દ્વારા એકત્રિત અને સંગ્રહિત કરવામાં આવેલ વિશાળ માત્રામાં ડેટાને સુરક્ષિત રીતે સંગ્રહિત કરવા માટે યોગ્ય ઈન્ફ્રાસ્ટ્રક્ચર બનાવ્યા વિના બિગ ડેટા ટેકનોલોજીનો આશરો લે છે. બીજી તરફ, બ્લોકચેન ટેક્નોલોજી હાલમાં ઝડપથી વિકસી રહી છે, જે આ અને અન્ય ઘણી સમસ્યાઓને ઉકેલવા માટે બનાવવામાં આવી છે.

બિગ ડેટા શું છે?

વાસ્તવમાં, શબ્દની વ્યાખ્યા સીધીસાદી છે: "મોટા ડેટા" નો અર્થ થાય છે ડેટાના ખૂબ મોટા જથ્થાનું સંચાલન, તેમજ તેમના વિશ્લેષણ. જો આપણે વધુ વ્યાપક રીતે જોઈએ, તો આ એવી માહિતી છે જે તેના મોટા જથ્થાને કારણે શાસ્ત્રીય પદ્ધતિઓ દ્વારા પ્રક્રિયા કરી શકાતી નથી.

બિગ ડેટા શબ્દ પોતે પ્રમાણમાં તાજેતરમાં દેખાયો. Google Trends અનુસાર, શબ્દની લોકપ્રિયતામાં સક્રિય વૃદ્ધિ 2011 ના અંતમાં થઈ હતી:

2010 માં, મોટા ડેટા પ્રોસેસિંગ સાથે સીધા સંબંધિત પ્રથમ ઉત્પાદનો અને ઉકેલો દેખાવા લાગ્યા. 2011 સુધીમાં, IBM, Oracle, Microsoft અને Hewlett-Packard સહિતની મોટાભાગની સૌથી મોટી IT કંપનીઓ તેમની બિઝનેસ વ્યૂહરચનાઓમાં બિગ ડેટા શબ્દનો સક્રિયપણે ઉપયોગ કરી રહી છે. ધીમે ધીમે, માહિતી ટેકનોલોજી બજાર વિશ્લેષકો આ ખ્યાલમાં સક્રિય સંશોધન શરૂ કરી રહ્યા છે.

હાલમાં, આ શબ્દ નોંધપાત્ર લોકપ્રિયતા મેળવી છે અને વિવિધ ક્ષેત્રોમાં સક્રિયપણે ઉપયોગમાં લેવાય છે. જો કે, એવું નિશ્ચિતપણે કહી શકાય નહીં કે બિગ ડેટા એ અમુક પ્રકારની મૂળભૂત રીતે નવી ઘટના છે - તેનાથી વિપરીત, મોટા ડેટા સ્ત્રોતો ઘણા વર્ષોથી અસ્તિત્વમાં છે. માર્કેટિંગમાં, આમાં ગ્રાહકની ખરીદી, ક્રેડિટ ઇતિહાસ, જીવનશૈલી વગેરેનો ડેટાબેસેસનો સમાવેશ થાય છે. વર્ષોથી, વિશ્લેષકોએ આ ડેટાનો ઉપયોગ કંપનીઓને ભાવિ ગ્રાહક જરૂરિયાતોની આગાહી કરવામાં, જોખમોનું મૂલ્યાંકન કરવા, ગ્રાહક પસંદગીઓને આકાર આપવા અને વધુ કરવામાં મદદ કરવા માટે કર્યો છે.

હાલમાં, પરિસ્થિતિ બે પાસાઓમાં બદલાઈ છે:

- વિવિધ ડેટા સેટનું વિશ્લેષણ અને સરખામણી કરવા માટે વધુ આધુનિક સાધનો અને પદ્ધતિઓ ઉભરી આવી છે;
— ડિજિટલ ટેક્નોલોજીમાં વ્યાપક સંક્રમણ તેમજ ડેટા સંગ્રહ અને માપનની નવી પદ્ધતિઓને કારણે વિશ્લેષણ સાધનોને ઘણા નવા ડેટા સ્ત્રોતો સાથે પૂરક બનાવવામાં આવ્યા છે.

સંશોધકો અનુમાન કરે છે કે બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ ઉત્પાદન, આરોગ્યસંભાળ, વેપાર, સરકારી વહીવટ અને અન્ય વિવિધ ક્ષેત્રો અને ઉદ્યોગોમાં સૌથી વધુ સક્રિય રીતે કરવામાં આવશે.

બિગ ડેટા એ ડેટાની ચોક્કસ શ્રેણી નથી, પરંતુ તેની પ્રક્રિયા કરવા માટેની પદ્ધતિઓનો સમૂહ છે. મોટા ડેટાની નિર્ણાયક લાક્ષણિકતા માત્ર તેનું પ્રમાણ જ નથી, પરંતુ અન્ય કેટેગરીઝ પણ છે જે શ્રમ-સઘન ડેટા પ્રોસેસિંગ અને વિશ્લેષણ પ્રક્રિયાઓને દર્શાવે છે.

પ્રક્રિયા માટે પ્રારંભિક ડેટા હોઈ શકે છે, ઉદાહરણ તરીકે:

— ઈન્ટરનેટ વપરાશકર્તા વર્તનના લોગ;
- વસ્તુઓનું ઇન્ટરનેટ;
- સામાજિક મીડિયા;
- હવામાનશાસ્ત્રની માહિતી;
- મુખ્ય પુસ્તકાલયોમાંથી ડિજિટલાઈઝ્ડ પુસ્તકો;
- વાહનોમાંથી જીપીએસ સિગ્નલો;
- બેંક ગ્રાહકોના વ્યવહારો વિશેની માહિતી;
- મોબાઇલ નેટવર્ક સબ્સ્ક્રાઇબર્સના સ્થાન પરનો ડેટા;
- મોટી છૂટક સાંકળોમાં ખરીદી વિશે માહિતી, વગેરે.

સમય જતાં, ડેટાની માત્રા અને તેના સ્ત્રોતોની સંખ્યા સતત વધી રહી છે, અને આ પૃષ્ઠભૂમિ સામે, માહિતી પ્રક્રિયાની નવી પદ્ધતિઓ ઉભરી રહી છે અને હાલની પદ્ધતિઓમાં સુધારો કરવામાં આવી રહ્યો છે.

મોટા ડેટાના મૂળભૂત સિદ્ધાંતો:

— હોરિઝોન્ટલ સ્કેલેબિલિટી – ડેટા એરે વિશાળ હોઈ શકે છે અને આનો અર્થ એ છે કે મોટી ડેટા પ્રોસેસિંગ સિસ્ટમ તેમના વોલ્યુમમાં વધારો થતાં ગતિશીલ રીતે વિસ્તરણ થવી જોઈએ.
- ફોલ્ટ સહિષ્ણુતા - જો કેટલાક સાધનોના ઘટકો નિષ્ફળ જાય તો પણ, સમગ્ર સિસ્ટમ કાર્યરત રહેવી જોઈએ.
- ડેટા સ્થાનિકતા. મોટી વિતરિત પ્રણાલીઓમાં, ડેટા સામાન્ય રીતે નોંધપાત્ર સંખ્યામાં મશીનો પર વિતરિત કરવામાં આવે છે. જો કે, જ્યારે પણ શક્ય હોય અને સંસાધનોને બચાવવા માટે, ડેટાને તે જ સર્વર પર પ્રક્રિયા કરવામાં આવે છે જ્યાં તેને સંગ્રહિત કરવામાં આવે છે.

ત્રણેય સિદ્ધાંતોના સ્થિર સંચાલન માટે અને તે મુજબ, મોટા ડેટાના સંગ્રહ અને પ્રક્રિયાની ઉચ્ચ કાર્યક્ષમતા માટે, નવી પ્રગતિશીલ તકનીકોની જરૂર છે, જેમ કે, ઉદાહરણ તરીકે, બ્લોકચેન.

આપણને મોટા ડેટાની કેમ જરૂર છે?

બિગ ડેટાનો અવકાશ સતત વિસ્તરી રહ્યો છે:

- બિગ ડેટાનો ઉપયોગ દવામાં થઈ શકે છે. આમ, દર્દીનું નિદાન માત્ર દર્દીના તબીબી ઇતિહાસના વિશ્લેષણના ડેટાના આધારે જ નહીં, પરંતુ અન્ય ડોકટરોના અનુભવ, દર્દીના રહેઠાણના વિસ્તારની પર્યાવરણીય પરિસ્થિતિ વિશેની માહિતીને ધ્યાનમાં રાખીને પણ કરી શકાય છે. અન્ય ઘણા પરિબળો.
- માનવરહિત વાહનોની હિલચાલને ગોઠવવા માટે બિગ ડેટા ટેકનોલોજીનો ઉપયોગ કરી શકાય છે.
— મોટી માત્રામાં ડેટા પર પ્રક્રિયા કરીને, તમે ફોટા અને વીડિયોમાં ચહેરાઓને ઓળખી શકો છો.
રિટેલરો દ્વારા બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ કરી શકાય છે - ટ્રેડિંગ કંપનીઓ તેમના અસરકારક રીતે ગોઠવવા માટે સોશિયલ નેટવર્કમાંથી ડેટા એરેનો સક્રિયપણે ઉપયોગ કરી શકે છે. જાહેરાત ઝુંબેશ, જે ચોક્કસ ઉપભોક્તા સેગમેન્ટને મહત્તમ રીતે લક્ષિત કરી શકાય છે.
— આ ટેક્નોલોજીનો ઉપયોગ સમાજમાં રાજકીય પસંદગીઓના પૃથ્થકરણ સહિત ચૂંટણી ઝુંબેશના આયોજનમાં સક્રિયપણે થાય છે.
- બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ આવકની ખાતરી (RA) વર્ગના ઉકેલો માટે સુસંગત છે, જેમાં અસંગતતાઓ શોધવા અને ઊંડાણપૂર્વકના ડેટા વિશ્લેષણ માટેના સાધનોનો સમાવેશ થાય છે, જે સંભવિત નુકસાન અથવા માહિતીની વિકૃતિની સમયસર ઓળખને મંજૂરી આપે છે જે ઘટાડા તરફ દોરી શકે છે. નાણાકીય પરિણામો.
— દૂરસંચાર પ્રદાતાઓ ભૌગોલિક સ્થાન સહિત મોટા ડેટાને એકત્ર કરી શકે છે; બદલામાં, આ માહિતી જાહેરાત એજન્સીઓ માટે વાણિજ્યિક હિતની હોઈ શકે છે, જે લક્ષિત અને સ્થાનિક જાહેરાતો તેમજ રિટેલર્સ અને બેંકોને પ્રદર્શિત કરવા માટે તેનો ઉપયોગ કરી શકે છે.
— લોકોના શક્તિશાળી લક્ષિત પ્રવાહની હાજરી વિશેના ડેટાના આધારે ચોક્કસ સ્થાન પર રિટેલ આઉટલેટ ખોલવાનું નક્કી કરવામાં બિગ ડેટા મહત્વપૂર્ણ ભૂમિકા ભજવી શકે છે.

આમ, બિગ ડેટા ટેક્નોલોજીનો સૌથી સ્પષ્ટ વ્યવહારુ ઉપયોગ માર્કેટિંગના ક્ષેત્રમાં રહેલો છે. ઈન્ટરનેટના વિકાસ અને તમામ પ્રકારના સંચાર ઉપકરણોના પ્રસારને કારણે, વર્તણૂકીય ડેટા (જેમ કે કૉલ્સની સંખ્યા, ખરીદીની આદતો અને ખરીદી) વાસ્તવિક સમયમાં ઉપલબ્ધ થઈ રહી છે.

બિગ ડેટા ટેક્નોલોજીનો અસરકારક રીતે ફાયનાન્સ, સમાજશાસ્ત્રીય સંશોધન અને અન્ય ઘણા ક્ષેત્રોમાં પણ ઉપયોગ કરી શકાય છે. નિષ્ણાતો દલીલ કરે છે કે મોટા ડેટાનો ઉપયોગ કરવા માટેની આ બધી તકો આઇસબર્ગનો માત્ર દૃશ્યમાન ભાગ છે, કારણ કે આ તકનીકોનો ઉપયોગ ગુપ્તચર અને કાઉન્ટર ઇન્ટેલિજન્સ, લશ્કરી બાબતોમાં, તેમજ સામાન્ય રીતે માહિતી યુદ્ધ તરીકે ઓળખાતી દરેક વસ્તુમાં થાય છે.

IN સામાન્ય રૂપરેખાબિગ ડેટા સાથે કામ કરવાના ક્રમમાં ડેટા એકત્ર કરવાનો, રિપોર્ટ્સ અને ડેશબોર્ડ્સનો ઉપયોગ કરીને પ્રાપ્ત માહિતીનું માળખું અને પછી કાર્યવાહી માટે ભલામણો ઘડવાનો સમાવેશ થાય છે.

ચાલો માર્કેટિંગમાં બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ કરવાની શક્યતાઓને ટૂંકમાં ધ્યાનમાં લઈએ. જેમ તમે જાણો છો, માર્કેટર માટે માહિતી એ આગાહી અને વ્યૂહરચના વિકાસનું મુખ્ય સાધન છે. મોટા ડેટા વિશ્લેષણનો લાંબા સમયથી લક્ષ્ય પ્રેક્ષકો, રુચિઓ, માંગ અને ગ્રાહકોની પ્રવૃત્તિ નક્કી કરવા માટે સફળતાપૂર્વક ઉપયોગ કરવામાં આવે છે. મોટા ડેટા વિશ્લેષણ, ખાસ કરીને, જાહેરાત પ્રદર્શિત કરવાનું શક્ય બનાવે છે (RTB હરાજી મોડલ - રીઅલ ટાઇમ બિડિંગ) માત્ર એવા ગ્રાહકોને જ કે જેઓ ઉત્પાદન અથવા સેવામાં રસ ધરાવતા હોય.

માર્કેટિંગમાં બિગ ડેટાનો ઉપયોગ ઉદ્યોગપતિઓને આની મંજૂરી આપે છે:

- તમારા ગ્રાહકોને વધુ સારી રીતે જાણો, ઇન્ટરનેટ પર સમાન પ્રેક્ષકોને આકર્ષિત કરો;
- ગ્રાહક સંતોષની ડિગ્રીનું મૂલ્યાંકન કરો;
- સમજો કે શું સૂચિત સેવા અપેક્ષાઓ અને જરૂરિયાતોને પૂર્ણ કરે છે;
- ગ્રાહક વિશ્વાસ વધારવાની નવી રીતો શોધો અને અમલમાં મુકો;
- માંગમાં હોય તેવા પ્રોજેક્ટ બનાવો, વગેરે.

ઉદાહરણ તરીકે, Google.trends સેવા માર્કેટરને ચોક્કસ ઉત્પાદન, વધઘટ અને ક્લિક્સની ભૂગોળ માટે મોસમી માંગ પ્રવૃત્તિની આગાહી સૂચવી શકે છે. જો તમે તમારી પોતાની વેબસાઇટ પર સંબંધિત પ્લગઇન દ્વારા એકત્રિત કરાયેલ આંકડાકીય માહિતી સાથે આ માહિતીની તુલના કરો છો, તો તમે મહિનો, પ્રદેશ અને અન્ય પરિમાણોને દર્શાવતા, જાહેરાત બજેટના વિતરણ માટે એક યોજના બનાવી શકો છો.

ઘણા સંશોધકોના મતે ટ્રમ્પ ચૂંટણી અભિયાનની સફળતા બિગ ડેટાના વિભાજન અને ઉપયોગમાં રહેલી છે. ભાવિ યુએસ પ્રમુખની ટીમ પ્રેક્ષકોને યોગ્ય રીતે વિભાજિત કરવામાં, તેની ઇચ્છાઓને સમજવામાં અને મતદારો જે જોવા અને સાંભળવા માંગે છે તે બરાબર સંદેશ બતાવવામાં સક્ષમ હતી. આમ, ડેટા-સેન્ટ્રિક એલાયન્સમાંથી ઇરિના બેલિશેવાના જણાવ્યા અનુસાર, ટ્રમ્પની જીત મોટાભાગે ઇન્ટરનેટ માર્કેટિંગ માટેના બિન-માનક અભિગમને કારણે શક્ય બની હતી, જે બિગ ડેટા, મનોવૈજ્ઞાનિક અને વર્તન વિશ્લેષણ અને વ્યક્તિગત જાહેરાત પર આધારિત હતી.

ટ્રમ્પના રાજકીય વ્યૂહરચનાકારો અને માર્કેટર્સે ખાસ વિકસિત ગાણિતિક મોડલનો ઉપયોગ કર્યો, જેણે તમામ યુએસ મતદારોના ડેટાનું ઊંડાણપૂર્વક વિશ્લેષણ કરવાનું અને તેમને વ્યવસ્થિત બનાવવાનું શક્ય બનાવ્યું, માત્ર ભૌગોલિક લાક્ષણિકતાઓ દ્વારા જ નહીં, પરંતુ મતદારોના ઇરાદાઓ, હિતોને ધ્યાનમાં રાખીને પણ અતિ-ચોક્કસ લક્ષ્યાંક બનાવવું શક્ય બન્યું. તેમના સાયકોટાઇપ, વર્તણૂકીય લાક્ષણિકતાઓ, વગેરે. આ પછી માર્કેટર્સે નાગરિકોના દરેક જૂથ સાથે તેમની જરૂરિયાતો, મૂડ, રાજકીય મંતવ્યો, મનોવૈજ્ઞાનિક લાક્ષણિકતાઓઅને ચામડીનો રંગ પણ, લગભગ દરેક વ્યક્તિગત મતદાર માટે અલગ સંદેશનો ઉપયોગ કરીને.

હિલેરી ક્લિન્ટનની વાત કરીએ તો, તેણીએ સમાજશાસ્ત્રીય ડેટા અને પ્રમાણભૂત માર્કેટિંગ પર આધારિત "સમય-પરીક્ષણ" પદ્ધતિઓનો ઉપયોગ કર્યો, મતદારોને માત્ર ઔપચારિક રીતે સમાન જૂથોમાં વિભાજીત કર્યા (પુરુષો, સ્ત્રીઓ, આફ્રિકન અમેરિકનો, લેટિન અમેરિકનો, ગરીબ, શ્રીમંત, વગેરે) .

પરિણામે, વિજેતા તે હતો જેણે નવી તકનીકીઓ અને વિશ્લેષણની પદ્ધતિઓની સંભાવનાની પ્રશંસા કરી. નોંધનીય છે કે હિલેરી ક્લિન્ટનનો પ્રચાર ખર્ચ તેમના પ્રતિસ્પર્ધી કરતા બમણો હતો:

ડેટા: પ્યુ સંશોધન

બિગ ડેટાના ઉપયોગની મુખ્ય સમસ્યાઓ

ઊંચા ખર્ચ ઉપરાંત, વિવિધ ક્ષેત્રોમાં બિગ ડેટાના અમલીકરણમાં અવરોધરૂપ મુખ્ય પરિબળોમાંની એક પ્રક્રિયા કરવા માટેના ડેટાને પસંદ કરવાની સમસ્યા છે: એટલે કે, કયા ડેટાને પુનઃપ્રાપ્ત, સંગ્રહિત અને વિશ્લેષણ કરવાની જરૂર છે તે નક્કી કરવું, અને કયા ધ્યાનમાં લેવામાં આવશે નહીં.

બિગ ડેટાની બીજી સમસ્યા એથિકલ છે. બીજા શબ્દોમાં કહીએ તો, એક તાર્કિક પ્રશ્ન ઊભો થાય છે: શું આવા ડેટા સંગ્રહને (ખાસ કરીને વપરાશકર્તાની જાણકારી વિના) ગોપનીયતાનું ઉલ્લંઘન ગણી શકાય?

તે કોઈ રહસ્ય નથી કે Google અને Yandex સર્ચ એન્જિનમાં સંગ્રહિત માહિતી IT જાયન્ટ્સને તેમની સેવાઓમાં સતત સુધારો કરવા, તેમને વપરાશકર્તા-મૈત્રીપૂર્ણ બનાવવા અને નવી ઇન્ટરેક્ટિવ એપ્લિકેશન બનાવવાની મંજૂરી આપે છે. આ કરવા માટે, શોધ એંજીન ઇન્ટરનેટ પર વપરાશકર્તાની પ્રવૃત્તિ, IP સરનામાં, ભૌગોલિક સ્થાન ડેટા, રુચિઓ અને ઑનલાઇન ખરીદીઓ, વ્યક્તિગત ડેટા, ઇમેઇલ સંદેશાઓ વગેરે વિશેનો વપરાશકર્તા ડેટા એકત્રિત કરે છે. આ બધું તમને પ્રદર્શિત કરવાની મંજૂરી આપે છે. સંદર્ભિત જાહેરાતઇન્ટરનેટ પર વપરાશકર્તાની વર્તણૂક અનુસાર. આ કિસ્સામાં, સામાન્ય રીતે આ માટે વપરાશકર્તાઓની સંમતિ પૂછવામાં આવતી નથી, અને પોતાને વિશે કઈ માહિતી પ્રદાન કરવી તે પસંદ કરવાની તક આપવામાં આવતી નથી. એટલે કે, ડિફૉલ્ટ રૂપે, બધું બિગ ડેટામાં એકત્રિત કરવામાં આવે છે, જે પછી સાઇટ્સના ડેટા સર્વર પર સંગ્રહિત કરવામાં આવશે.

આ ડેટા સ્ટોરેજ અને ઉપયોગની સુરક્ષાને લગતી આગામી મહત્વપૂર્ણ સમસ્યા તરફ દોરી જાય છે. ઉદાહરણ તરીકે, શું કોઈ ચોક્કસ વિશ્લેષણાત્મક પ્લેટફોર્મ કે જેના પર ઉપભોક્તાઓ આપમેળે તેમના ડેટાને સુરક્ષિત રીતે સ્થાનાંતરિત કરે છે? વધુમાં, ઘણા વ્યાપારી પ્રતિનિધિઓ ઉચ્ચ લાયકાત ધરાવતા વિશ્લેષકો અને માર્કેટર્સની અછતની નોંધ લે છે જેઓ અસરકારક રીતે મોટા પ્રમાણમાં ડેટાને હેન્ડલ કરી શકે છે અને તેમની મદદ વડે ચોક્કસ વ્યવસાયિક સમસ્યાઓ હલ કરી શકે છે.

બિગ ડેટાના અમલીકરણમાં તમામ મુશ્કેલીઓ હોવા છતાં, વ્યવસાય આ ક્ષેત્રમાં રોકાણ વધારવાનો ઇરાદો ધરાવે છે. ગાર્ટનર સંશોધન મુજબ, બિગ ડેટામાં રોકાણ કરનારા ઉદ્યોગોના અગ્રણીઓ મીડિયા, રિટેલ, ટેલિકોમ, બેન્કિંગ અને સર્વિસ કંપનીઓ છે.

બ્લોકચેન અને બિગ ડેટા ટેકનોલોજી વચ્ચેની ક્રિયાપ્રતિક્રિયા માટેની સંભાવનાઓ

બિગ ડેટા સાથેના એકીકરણની સિનર્જિસ્ટિક અસર હોય છે અને બિઝનેસ માટે નવી તકોની વિશાળ શ્રેણી ખોલે છે, જેમાં મંજૂરી આપવામાં આવી છે:

— ગ્રાહક પસંદગીઓ વિશે વિગતવાર માહિતીની ઍક્સેસ મેળવો, જેના આધારે તમે ચોક્કસ સપ્લાયર્સ, ઉત્પાદનો અને ઉત્પાદન ઘટકો માટે વિગતવાર વિશ્લેષણાત્મક પ્રોફાઇલ બનાવી શકો છો;
- વપરાશકર્તાઓની વિવિધ શ્રેણીઓ દ્વારા માલના ચોક્કસ જૂથોના વ્યવહારો અને વપરાશના આંકડા પર વિગતવાર ડેટા એકીકૃત કરો;
- પુરવઠા અને વપરાશની સાંકળો પર વિગતવાર વિશ્લેષણાત્મક ડેટા મેળવો, પરિવહન દરમિયાન ઉત્પાદનના નુકસાનને નિયંત્રિત કરો (ઉદાહરણ તરીકે, ચોક્કસ પ્રકારના માલના સૂકવણી અને બાષ્પીભવનને કારણે વજનમાં ઘટાડો);
- ઉત્પાદનની નકલનો સામનો કરવો, મની લોન્ડરિંગ અને છેતરપિંડી સામેની લડતની અસરકારકતા વધારવી, વગેરે.

માલસામાનના ઉપયોગ અને વપરાશ અંગેના વિગતવાર ડેટાની ઍક્સેસ મુખ્ય વ્યવસાયિક પ્રક્રિયાઓને ઑપ્ટિમાઇઝ કરવા, નિયમનકારી જોખમો ઘટાડવા, મુદ્રીકરણ માટેની નવી તકો જાહેર કરવા અને વર્તમાન ઉપભોક્તાની પસંદગીઓને શ્રેષ્ઠ રીતે પૂરી કરે તેવા ઉત્પાદનો બનાવવા માટે બિગ ડેટા ટેક્નોલોજીની સંભવિતતાને નોંધપાત્ર રીતે પ્રગટ કરશે.

જેમ જાણીતું છે, સૌથી મોટી નાણાકીય સંસ્થાઓના પ્રતિનિધિઓ પહેલેથી જ બ્લોકચેન ટેક્નોલોજીમાં નોંધપાત્ર રસ દાખવી રહ્યા છે, વગેરે. મિનિટ".

બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ કરીને બ્લોકચેનમાંથી વિશ્લેષણની સંભાવના પ્રચંડ છે. ડિસ્ટ્રિબ્યુટેડ લેજર ટેકનોલોજી માહિતીની અખંડિતતા તેમજ સમગ્ર વ્યવહાર ઇતિહાસના વિશ્વસનીય અને પારદર્શક સ્ટોરેજની ખાતરી કરે છે. બદલામાં, બિગ ડેટા, અસરકારક વિશ્લેષણ, આગાહી, આર્થિક મોડેલિંગ માટે નવા સાધનો પૂરા પાડે છે અને તે મુજબ, વધુ જાણકાર મેનેજમેન્ટ નિર્ણયો લેવા માટે નવી તકો ખોલે છે.

બ્લોકચેન અને બિગ ડેટાના ટેન્ડમનો આરોગ્ય સંભાળમાં સફળતાપૂર્વક ઉપયોગ કરી શકાય છે. જેમ જાણીતું છે, દર્દીના સ્વાસ્થ્ય પર અપૂર્ણ અને અપૂર્ણ ડેટા ખોટા નિદાન અને ખોટી રીતે સૂચવવામાં આવેલી સારવારના જોખમને મોટા પ્રમાણમાં વધારે છે. તબીબી સંસ્થાઓના ગ્રાહકોના સ્વાસ્થ્ય વિશેના નિર્ણાયક ડેટાને મહત્તમ રીતે સુરક્ષિત રાખવું જોઈએ, અપરિવર્તનક્ષમતાના ગુણધર્મો હોવા જોઈએ, ચકાસી શકાય તેવું હોવું જોઈએ અને કોઈપણ હેરફેરને આધિન ન હોવું જોઈએ.

બ્લોકચેનમાંની માહિતી ઉપરોક્ત તમામ જરૂરિયાતોને પૂર્ણ કરે છે અને નવી બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ કરીને ઊંડાણપૂર્વક વિશ્લેષણ માટે ઉચ્ચ-ગુણવત્તા અને વિશ્વસનીય સ્ત્રોત ડેટા તરીકે સેવા આપી શકે છે. વધુમાં, બ્લોકચેનની મદદથી, તબીબી સંસ્થાઓ વીમા કંપનીઓ, ન્યાય સત્તાવાળાઓ, નોકરીદાતાઓ, વૈજ્ઞાનિક સંસ્થાઓ અને તબીબી માહિતીની જરૂર હોય તેવી અન્ય સંસ્થાઓ સાથે વિશ્વસનીય ડેટાની આપલે કરી શકે છે.

મોટા ડેટા અને માહિતી સુરક્ષા

વ્યાપક અર્થમાં, માહિતી સુરક્ષા એ કુદરતી અથવા કૃત્રિમ પ્રકૃતિની આકસ્મિક અથવા ઇરાદાપૂર્વકની નકારાત્મક અસરોથી માહિતી અને સહાયક માળખાકીય સુવિધાઓનું રક્ષણ છે.

માહિતી સુરક્ષાના ક્ષેત્રમાં, બિગ ડેટા નીચેના પડકારોનો સામનો કરે છે:

- ડેટા સંરક્ષણની સમસ્યાઓ અને તેમની અખંડિતતાની ખાતરી;
- બહારની દખલગીરી અને ગોપનીય માહિતીના લીક થવાનું જોખમ;
- ગોપનીય માહિતીનો અયોગ્ય સંગ્રહ;
- માહિતી ગુમાવવાનું જોખમ, ઉદાહરણ તરીકે, કોઈની દૂષિત ક્રિયાઓને કારણે;
- તૃતીય પક્ષો દ્વારા વ્યક્તિગત ડેટાના દુરુપયોગનું જોખમ, વગેરે.

માહિતી સુરક્ષાના ક્ષેત્રમાં જૂઠાણાને ઉકેલવા માટે બ્લોકચેન રચાયેલ મુખ્ય મોટી ડેટા સમસ્યાઓમાંની એક. તેના તમામ મૂળભૂત સિદ્ધાંતોનું પાલન સુનિશ્ચિત કરીને, વિતરિત રજિસ્ટ્રી ટેકનોલોજી ડેટાની અખંડિતતા અને વિશ્વસનીયતાની ખાતરી આપી શકે છે, અને નિષ્ફળતાના એક બિંદુની ગેરહાજરીને કારણે, બ્લોકચેન માહિતી પ્રણાલીઓના સંચાલનને સ્થિર બનાવે છે. ડિસ્ટ્રિબ્યુટેડ લેજર ટેકનોલોજી ડેટામાં વિશ્વાસની સમસ્યાને ઉકેલવામાં મદદ કરી શકે છે, તેમજ સાર્વત્રિક ડેટા શેરિંગને સક્ષમ કરી શકે છે.

માહિતી એ એક મૂલ્યવાન સંપત્તિ છે, જેનો અર્થ છે કે માહિતી સુરક્ષાના મૂળભૂત પાસાઓને સુનિશ્ચિત કરવામાં મોખરે હોવું આવશ્યક છે. સ્પર્ધામાં ટકી રહેવા માટે, કંપનીઓએ સમય સાથે સુસંગત રહેવું જોઈએ, જેનો અર્થ છે કે તેઓ બ્લોકચેન ટેક્નોલોજી અને બિગ ડેટા ટૂલ્સમાં સમાવિષ્ટ સંભવિત તકો અને ફાયદાઓને અવગણી શકે નહીં.

મોટા ડેટા સાથે કામ કરવાના કિસ્સાઓ અને દંતકથાઓ વિશે HSE શિક્ષકો દ્વારા કૉલમ

બુકમાર્ક્સ માટે

નેશનલ રિસર્ચ યુનિવર્સિટી હાયર સ્કૂલ ઑફ ઇકોનોમિક્સ કોન્સ્ટેન્ટિન રોમાનોવ અને એલેક્ઝાંડર પ્યાતિગોર્સ્કી, જેઓ બેલાઇન ખાતે ડિજિટલ ટ્રાન્સફોર્મેશનના ડિરેક્ટર પણ છે, ખાતે સ્કૂલ ઑફ ન્યૂ મીડિયાના શિક્ષકોએ મોટા ડેટા વિશેની મુખ્ય ગેરસમજો વિશે સાઇટ માટે કૉલમ લખી હતી - ઉપયોગના ઉદાહરણો ટેકનોલોજી અને સાધનો. લેખકો સૂચવે છે કે પ્રકાશન કંપનીના સંચાલકોને આ ખ્યાલને સમજવામાં મદદ કરશે.

બિગ ડેટા વિશે માન્યતાઓ અને ગેરમાન્યતાઓ

બિગ ડેટા માર્કેટિંગ નથી

બિગ ડેટા શબ્દ ખૂબ જ ફેશનેબલ બની ગયો છે - તેનો ઉપયોગ લાખો પરિસ્થિતિઓમાં અને સેંકડોમાં થાય છે વિવિધ અર્થઘટન, ઘણીવાર તે શું છે તેની સાથે કોઈ લેવાદેવા નથી. ખ્યાલો ઘણીવાર લોકોના માથામાં સ્થાનાંતરિત થાય છે, અને બિગ ડેટા માર્કેટિંગ પ્રોડક્ટ સાથે મૂંઝવણમાં છે. તદુપરાંત, કેટલીક કંપનીઓમાં બિગ ડેટા માર્કેટિંગ વિભાગનો ભાગ છે. મોટા ડેટા વિશ્લેષણનું પરિણામ ખરેખર માર્કેટિંગ પ્રવૃત્તિ માટે સ્ત્રોત બની શકે છે, પરંતુ વધુ કંઈ નથી. ચાલો જોઈએ કે તે કેવી રીતે કાર્ય કરે છે.

જો અમે બે મહિના પહેલા અમારા સ્ટોરમાં ત્રણ હજાર રુબેલ્સથી વધુ કિંમતનો માલ ખરીદનારા લોકોની સૂચિને ઓળખી કાઢીએ અને પછી આ વપરાશકર્તાઓને અમુક પ્રકારની ઑફર મોકલી, તો આ લાક્ષણિક માર્કેટિંગ છે. અમે માળખાકીય ડેટામાંથી સ્પષ્ટ પેટર્ન મેળવીએ છીએ અને વેચાણ વધારવા માટે તેનો ઉપયોગ કરીએ છીએ.

જો કે, જો આપણે CRM ડેટાને સ્ટ્રીમિંગ માહિતી સાથે જોડીએ છીએ, ઉદાહરણ તરીકે, Instagram, અને તેનું વિશ્લેષણ કરીએ છીએ, તો અમને એક પેટર્ન મળે છે: જે વ્યક્તિએ બુધવારે સાંજે તેની પ્રવૃત્તિમાં ઘટાડો કર્યો છે અને જેનો નવીનતમ ફોટો બિલાડીના બચ્ચાં બતાવે છે તેણે ચોક્કસ ઓફર કરવી જોઈએ. આ પહેલેથી જ બિગ ડેટા હશે. અમને એક ટ્રિગર મળ્યું, તેને માર્કેટર્સ સુધી પહોંચાડ્યું, અને તેઓએ તેનો ઉપયોગ તેમના પોતાના હેતુઓ માટે કર્યો.

તે આનાથી અનુસરે છે કે ટેક્નોલોજી સામાન્ય રીતે અનસ્ટ્રક્ચર્ડ ડેટા સાથે કામ કરે છે, અને જો ડેટા સ્ટ્રક્ચર્ડ હોય, તો પણ સિસ્ટમ તેમાં છુપાયેલા દાખલાઓ શોધવાનું ચાલુ રાખે છે, જે માર્કેટિંગ કરતું નથી.

બિગ ડેટા આઈટી નથી

આ વાર્તાની બીજી ચરમસીમા: મોટા ડેટા ઘણીવાર IT સાથે મૂંઝવણમાં હોય છે. આ એ હકીકતને કારણે છે કે રશિયન કંપનીઓમાં, એક નિયમ તરીકે, આઇટી નિષ્ણાતો મોટા ડેટા સહિત તમામ તકનીકોના ડ્રાઇવરો છે. તેથી, જો આ વિભાગમાં બધું થાય છે, તો સમગ્ર કંપનીને એવી છાપ મળે છે કે આ એક પ્રકારની IT પ્રવૃત્તિ છે.

વાસ્તવમાં, અહીં એક મૂળભૂત તફાવત છે: બિગ ડેટા એ ચોક્કસ ઉત્પાદન મેળવવાના હેતુથી એક પ્રવૃત્તિ છે, જે IT સાથે બિલકુલ સંબંધિત નથી, જો કે તેના વિના ટેક્નોલોજી અસ્તિત્વમાં નથી.

બિગ ડેટા હંમેશા માહિતીનો સંગ્રહ અને વિશ્લેષણ નથી

બિગ ડેટા વિશે બીજી એક ગેરસમજ છે. દરેક વ્યક્તિ સમજે છે કે આ ટેક્નોલોજીમાં મોટી માત્રામાં ડેટાનો સમાવેશ થાય છે, પરંતુ કયા પ્રકારના ડેટાનો અર્થ હંમેશા સ્પષ્ટ હોતો નથી. કોઈપણ માહિતી એકત્રિત કરી શકે છે અને તેનો ઉપયોગ કરી શકે છે; હવે આ ફક્ત ફિલ્મોમાં જ નહીં, પણ કોઈપણ, ખૂબ નાની કંપનીમાં પણ શક્ય છે. એકમાત્ર પ્રશ્ન એ છે કે બરાબર શું એકત્રિત કરવું અને તમારા ફાયદા માટે તેનો ઉપયોગ કેવી રીતે કરવો.

પરંતુ એ સમજી લેવું જોઈએ કે બિગ ડેટા ટેક્નોલોજી એ કોઈ પણ પ્રકારની માહિતીનો સંગ્રહ અને વિશ્લેષણ નહીં હોય. ઉદાહરણ તરીકે, જો તમે સોશિયલ નેટવર્ક પર કોઈ ચોક્કસ વ્યક્તિ વિશેનો ડેટા એકત્રિત કરો છો, તો તે બિગ ડેટા નહીં હોય.

બિગ ડેટા ખરેખર શું છે?

મોટા ડેટામાં ત્રણ ઘટકોનો સમાવેશ થાય છે:

  • માહિતી;
  • વિશ્લેષણ;
  • ટેકનોલોજી

બિગ ડેટા માત્ર આ ઘટકોમાંથી એક નથી, પરંતુ ત્રણેય ઘટકોનું સંયોજન છે. લોકો ઘણીવાર વિભાવનાઓને બદલે છે: કેટલાક માને છે કે બિગ ડેટા માત્ર ડેટા છે, અન્ય માને છે કે તે ટેકનોલોજી છે. પરંતુ વાસ્તવમાં, તમે ગમે તેટલો ડેટા એકત્રિત કરો, તમે યોગ્ય ટેક્નોલોજી અને એનાલિટિક્સ વિના તેની સાથે કંઈપણ કરી શકશો નહીં. જો સારા એનાલિટિક્સ છે, પરંતુ કોઈ ડેટા નથી, તો તે વધુ ખરાબ છે.

જો આપણે ડેટા વિશે વાત કરીએ, તો આ ફક્ત ટેક્સ્ટ્સ જ નથી, પણ Instagram પર પોસ્ટ કરાયેલા તમામ ફોટા પણ છે, અને સામાન્ય રીતે દરેક વસ્તુનું વિશ્લેષણ અને વિવિધ હેતુઓ અને કાર્યો માટે ઉપયોગ કરી શકાય છે. બીજા શબ્દોમાં કહીએ તો, ડેટા વિવિધ માળખાના આંતરિક અને બાહ્ય ડેટાના વિશાળ વોલ્યુમનો સંદર્ભ આપે છે.

એનાલિટિક્સ પણ જરૂરી છે, કારણ કે બિગ ડેટાનું કાર્ય અમુક પેટર્ન બનાવવાનું છે. એટલે કે, વિશ્લેષકો એ છુપાયેલી નિર્ભરતાની ઓળખ અને વિજાતીય ડેટાના સમગ્ર વોલ્યુમના વિશ્લેષણના આધારે નવા પ્રશ્નો અને જવાબોની શોધ છે. તદુપરાંત, બિગ ડેટા એવા પ્રશ્નો ઉભા કરે છે જે સીધા આ ડેટામાંથી મેળવી શકાતા નથી.

જ્યારે છબીઓની વાત આવે છે, ત્યારે હકીકત એ છે કે તમે વાદળી ટી-શર્ટ પહેરીને તમારો ફોટો પોસ્ટ કરો છો તેનો કોઈ અર્થ નથી. પરંતુ જો તમે બિગ ડેટા મોડેલિંગ માટે ફોટોગ્રાફીનો ઉપયોગ કરો છો, તો તમને લાગશે કે અત્યારે તમારે લોન ઓફર કરવી જોઈએ, કારણ કે તમારા સામાજિક જૂથઆવી વર્તણૂક ક્રિયાઓમાં ચોક્કસ ઘટના સૂચવે છે. તેથી, છુપાયેલા અને બિન-સ્પષ્ટ અવલંબનને ઓળખ્યા વિના વિશ્લેષણ વિનાનો "બેર" ડેટા બિગ ડેટા નથી.

તેથી અમારી પાસે મોટો ડેટા છે. તેમની શ્રેણી વિશાળ છે. અમારી પાસે વિશ્લેષક પણ છે. પરંતુ આપણે કેવી રીતે ખાતરી કરી શકીએ કે આ કાચા ડેટામાંથી આપણે ચોક્કસ ઉકેલ સાથે આવીએ છીએ? આ કરવા માટે, અમને એવી તકનીકીઓની જરૂર છે જે અમને ફક્ત તેમને સંગ્રહિત કરવાની જ નહીં (અને આ પહેલાં અશક્ય હતું), પણ તેનું વિશ્લેષણ કરવાની પણ મંજૂરી આપે છે.

સરળ શબ્દોમાં કહીએ તો, જો તમારી પાસે ઘણો ડેટા હોય, તો તમારે તકનીકીની જરૂર પડશે, ઉદાહરણ તરીકે, Hadoop, જે પછીના વિશ્લેષણ માટે તમામ માહિતીને તેના મૂળ સ્વરૂપમાં સંગ્રહિત કરવાનું શક્ય બનાવે છે. આ પ્રકારની ટેક્નોલોજી ઈન્ટરનેટ જાયન્ટ્સમાં ઊભી થઈ, કારણ કે તેઓ સૌથી પહેલા ડેટાનો મોટો જથ્થો સંગ્રહિત કરવાની અને અનુગામી મુદ્રીકરણ માટે તેનું વિશ્લેષણ કરવાની સમસ્યાનો સામનો કરતા હતા.

ઑપ્ટિમાઇઝ અને સસ્તા ડેટા સ્ટોરેજ માટેના ટૂલ્સ ઉપરાંત, તમારે વિશ્લેષણાત્મક સાધનો તેમજ ઉપયોગમાં લેવાતા પ્લેટફોર્મ પર એડ-ઑન્સની જરૂર છે. ઉદાહરણ તરીકે, હડૂપની આસપાસ સંબંધિત પ્રોજેક્ટ્સ અને ટેક્નોલોજીઓનું સંપૂર્ણ ઇકોસિસ્ટમ પહેલેથી જ રચાઈ ગયું છે. અહીં તેમાંથી કેટલાક છે:

  • પિગ એ ઘોષણાત્મક ડેટા વિશ્લેષણ ભાષા છે.
  • મધપૂડો - SQL જેવી ભાષાનો ઉપયોગ કરીને ડેટા વિશ્લેષણ.
  • Oozie - Hadoop વર્કફ્લો.
  • Hbase એ ડેટાબેઝ છે (બિન-રિલેશનલ), ગૂગલ બિગ ટેબલ જેવું જ.
  • માહુત - મશીન લર્નિંગ.
  • Sqoop - RSDB માંથી Hadoop અને ઊલટું ડેટા ટ્રાન્સફર કરી રહ્યું છે.
  • ફ્લુમ - લોગને HDFS માં સ્થાનાંતરિત કરવું.
  • Zookeeper, MRUnit, Avro, Giraph, Ambari, Cassandra, HCatalog, Fuse-DFS અને તેથી વધુ.

આ તમામ ટૂલ્સ દરેક માટે મફતમાં ઉપલબ્ધ છે, પરંતુ ત્યાં સંખ્યાબંધ પેઇડ એડ-ઓન્સ પણ છે.

વધુમાં, નિષ્ણાતોની જરૂર છે: એક વિકાસકર્તા અને વિશ્લેષક (કહેવાતા ડેટા સાયન્ટિસ્ટ). એક મેનેજરની પણ જરૂર છે જે ચોક્કસ સમસ્યાને ઉકેલવા માટે આ વિશ્લેષણને કેવી રીતે લાગુ કરવું તે સમજી શકે, કારણ કે જો તે વ્યવસાયિક પ્રક્રિયાઓમાં સંકલિત ન હોય તો તે પોતે સંપૂર્ણપણે અર્થહીન છે.

ત્રણેય કર્મચારીઓએ એક ટીમ તરીકે કામ કરવું જોઈએ. એક મેનેજર કે જે ડેટા સાયન્સ નિષ્ણાતને ચોક્કસ પેટર્ન શોધવાનું કાર્ય આપે છે તેણે સમજવું જોઈએ કે તે હંમેશા તેને જે જોઈએ છે તે બરાબર શોધી શકશે નહીં. આ કિસ્સામાં, મેનેજરે ડેટા સાયન્ટિસ્ટને જે મળ્યું તે ધ્યાનથી સાંભળવું જોઈએ, કારણ કે ઘણીવાર તેના તારણો વ્યવસાય માટે વધુ રસપ્રદ અને ઉપયોગી હોય છે. તમારું કાર્ય આને વ્યવસાયમાં લાગુ કરવાનું અને તેમાંથી ઉત્પાદન બનાવવાનું છે.

હકીકત એ છે કે હવે ઘણા પ્રકારના મશીનો અને તકનીકો હોવા છતાં, અંતિમ નિર્ણય હંમેશા વ્યક્તિ સાથે રહે છે. આ કરવા માટે, માહિતીને કોઈક રીતે વિઝ્યુઅલાઈઝ કરવાની જરૂર છે. આ માટે ઘણા બધા સાધનો છે.

સૌથી વધુ કહેવાનું ઉદાહરણ ભૂ-વિશ્લેષણાત્મક અહેવાલો છે. બીલાઇન કંપની વિવિધ શહેરો અને પ્રદેશોની સરકારો સાથે ઘણું કામ કરે છે. ઘણી વાર, આ સંસ્થાઓ "ચોક્કસ સ્થાન પર ટ્રાફિકની ભીડ" જેવા અહેવાલો ઓર્ડર કરે છે.

તે સ્પષ્ટ છે કે આવા અહેવાલ સરળ અને સમજી શકાય તેવા સ્વરૂપમાં સરકારી એજન્સીઓ સુધી પહોંચવા જોઈએ. જો આપણે તેમને એક વિશાળ અને સંપૂર્ણપણે અગમ્ય કોષ્ટક પ્રદાન કરીએ (એટલે ​​​​કે, જે ફોર્મમાં આપણે તેને પ્રાપ્ત કરીએ છીએ તે માહિતી), તેઓ આવા અહેવાલ ખરીદવાની શક્યતા નથી - તે સંપૂર્ણપણે નકામું હશે, તેઓ તેમાંથી જ્ઞાન મેળવી શકશે નહીં તેઓ પ્રાપ્ત કરવા માંગતા હતા.

તેથી, ડેટા વૈજ્ઞાનિકો ગમે તેટલા સારા હોય અને તેઓ ગમે તે પેટર્ન શોધતા હોય, તમે સારા વિઝ્યુલાઇઝેશન ટૂલ્સ વિના આ ડેટા સાથે કામ કરી શકશો નહીં.

ડેટા સ્ત્રોતો

પ્રાપ્ત માહિતીની શ્રેણી ખૂબ મોટી છે, તેથી તેને ઘણા જૂથોમાં વિભાજિત કરી શકાય છે.

આંતરિક કંપની ડેટા

જો કે એકત્રિત કરવામાં આવેલ 80% ડેટા આ જૂથનો છે, આ સ્ત્રોતનો હંમેશા ઉપયોગ થતો નથી. મોટેભાગે આ એવો ડેટા હોય છે જેની કોઈને જરૂર હોતી નથી, ઉદાહરણ તરીકે, લોગ. પરંતુ જો તમે તેમને અલગ ખૂણાથી જુઓ, તો તમે કેટલીકવાર તેમાં અણધારી પેટર્ન શોધી શકો છો.

શેરવેર સ્ત્રોતો

આમાં સામાજિક નેટવર્ક્સ, ઇન્ટરનેટ અને મફતમાં એક્સેસ કરી શકાય તે દરેક વસ્તુનો ડેટા શામેલ છે. શા માટે તે શેરવેર મફત છે? એક તરફ, આ ડેટા દરેક માટે ઉપલબ્ધ છે, પરંતુ જો તમે મોટી કંપની છો, તો પછી તેને હજારો, સેંકડો અથવા લાખો ગ્રાહકોના સબ્સ્ક્રાઇબર બેઝના કદમાં મેળવવું હવે સરળ કાર્ય નથી. તેથી, આ ડેટા પ્રદાન કરવા માટે બજારમાં ચૂકવણી સેવાઓ છે.

ચૂકવેલ સ્ત્રોતો

આમાં તે કંપનીઓનો સમાવેશ થાય છે જે પૈસા માટે ડેટા વેચે છે. આ ટેલિકોમ, ડીએમપી, ઈન્ટરનેટ કંપનીઓ, ક્રેડિટ બ્યુરો અને એગ્રીગેટર્સ હોઈ શકે છે. રશિયામાં, ટેલિકોમ ડેટા વેચતા નથી. પ્રથમ, તે આર્થિક રીતે બિનલાભકારી છે, અને બીજું, તે કાયદા દ્વારા પ્રતિબંધિત છે. તેથી, તેઓ તેમની પ્રક્રિયાના પરિણામોનું વેચાણ કરે છે, ઉદાહરણ તરીકે, ભૂ-વિશ્લેષણાત્મક અહેવાલો.

ડેટા ખોલો

રાજ્ય વ્યવસાયોને અનુકૂળ છે અને તેઓ જે ડેટા એકત્રિત કરે છે તેનો ઉપયોગ કરવાની તક આપે છે. પશ્ચિમમાં આ મોટા પ્રમાણમાં વિકસિત છે, પરંતુ આ સંદર્ભે રશિયા પણ સમય સાથે તાલમેલ રાખે છે. ઉદાહરણ તરીકે, મોસ્કો સરકારનું એક ઓપન ડેટા પોર્ટલ છે, જ્યાં વિવિધ શહેરી માળખાકીય સુવિધાઓની માહિતી પ્રકાશિત કરવામાં આવે છે.

મોસ્કોના રહેવાસીઓ અને મહેમાનો માટે, ડેટા ટેબ્યુલર અને કાર્ટોગ્રાફિક સ્વરૂપમાં રજૂ કરવામાં આવે છે, અને વિકાસકર્તાઓ માટે - ખાસ મશીન-વાંચી શકાય તેવા ફોર્મેટમાં. જ્યારે પ્રોજેક્ટ મર્યાદિત સ્થિતિમાં કામ કરી રહ્યો છે, ત્યારે તે વિકાસ કરી રહ્યો છે, જેનો અર્થ છે કે તે ડેટાનો સ્ત્રોત પણ છે જેનો ઉપયોગ તમે તમારા વ્યવસાયિક કાર્યો માટે કરી શકો છો.

સંશોધન

પહેલેથી જ નોંધ્યું છે તેમ, બિગ ડેટાનું કાર્ય પેટર્ન શોધવાનું છે. મોટે ભાગે, વિશ્વભરમાં હાથ ધરવામાં આવેલ સંશોધન ચોક્કસ પેટર્ન શોધવા માટે એક આધાર બની શકે છે - તમે ચોક્કસ પરિણામ મેળવી શકો છો અને તમારા પોતાના હેતુઓ માટે સમાન તર્ક લાગુ કરવાનો પ્રયાસ કરી શકો છો.

બિગ ડેટા એ એક ક્ષેત્ર છે જેમાં ગણિતના તમામ નિયમો લાગુ પડતા નથી. ઉદાહરણ તરીકે, “1” + “1” એ “2” નથી, પરંતુ ઘણું બધું છે, કારણ કે ડેટા સ્ત્રોતોને મિશ્રિત કરીને અસર નોંધપાત્ર રીતે વધારી શકાય છે.

ઉત્પાદન ઉદાહરણો

ઘણા લોકો સંગીત પસંદગી સેવા Spotify થી પરિચિત છે. તે સરસ છે કારણ કે તે વપરાશકર્તાઓને તેમનો મૂડ આજે શું છે તે પૂછતું નથી, પરંતુ તેના માટે ઉપલબ્ધ સ્ત્રોતોના આધારે તેની ગણતરી કરે છે. તે હંમેશા જાણે છે કે તમારે હવે શું જોઈએ છે - જાઝ અથવા હાર્ડ રોક. આ મુખ્ય તફાવત છે જે તેને ચાહકો સાથે પ્રદાન કરે છે અને તેને અન્ય સેવાઓથી અલગ પાડે છે.

આવા ઉત્પાદનોને સામાન્ય રીતે સેન્સ પ્રોડક્ટ્સ કહેવામાં આવે છે - જે તેમના ગ્રાહકોને અનુભવે છે.

બિગ ડેટા ટેકનોલોજીનો ઉપયોગ ઓટોમોટિવ ઉદ્યોગમાં પણ થાય છે. ઉદાહરણ તરીકે, ટેસ્લા આ કરે છે - તેમનામાં નવીનતમ મોડેલએક ઓટોપાયલટ છે. કંપની એવી કાર બનાવવાનો પ્રયત્ન કરે છે જે પોતે જ પેસેન્જરને જ્યાં જવાની જરૂર હોય ત્યાં લઈ જાય. બિગ ડેટા વિના, આ અશક્ય છે, કારણ કે જો આપણે ફક્ત તે જ ડેટાનો ઉપયોગ કરીએ છીએ જે આપણે સીધો પ્રાપ્ત કરીએ છીએ, જેમ કે વ્યક્તિ કરે છે, તો કાર સુધારી શકશે નહીં.

જ્યારે આપણે જાતે કાર ચલાવીએ છીએ, ત્યારે આપણે ધ્યાન પણ આપતા નથી તેવા ઘણા પરિબળોના આધારે નિર્ણયો લેવા માટે અમે અમારા ન્યુરોન્સનો ઉપયોગ કરીએ છીએ. ઉદાહરણ તરીકે, અમે કદાચ સમજી શકતા નથી કે અમે શા માટે લીલી લાઇટ પર તરત જ વેગ ન લેવાનું નક્કી કર્યું, પરંતુ પછી તે તારણ આપે છે કે નિર્ણય સાચો હતો - એક કાર બેકનેક સ્પીડમાં તમારી પાસેથી પસાર થઈ, અને તમે અકસ્માત ટાળ્યો.

તમે સ્પોર્ટ્સમાં બિગ ડેટાના ઉપયોગનું ઉદાહરણ પણ આપી શકો છો. 2002 માં, ઓકલેન્ડ એથ્લેટિક્સ બેઝબોલ ટીમના જનરલ મેનેજર, બિલી બીને, એથ્લેટ્સની ભરતી કેવી રીતે કરવી તે પેરાડાઈમ તોડવાનું નક્કી કર્યું - તેણે "સંખ્યા દ્વારા" ખેલાડીઓની પસંદગી કરી અને તેમને તાલીમ આપી.

સામાન્ય રીતે મેનેજરો ખેલાડીઓની સફળતાને જુએ છે, પરંતુ આ કિસ્સામાં બધું અલગ હતું - પરિણામો મેળવવા માટે, મેનેજરે વ્યક્તિગત લાક્ષણિકતાઓ પર ધ્યાન આપતા, રમતવીરોના કયા સંયોજનોની જરૂર છે તેનો અભ્યાસ કર્યો. તદુપરાંત, તેણે એથ્લેટ્સ પસંદ કર્યા કે જેમની પાસે પોતાની જાતમાં વધુ સંભાવના ન હતી, પરંતુ સમગ્ર ટીમ એટલી સફળ થઈ કે તેઓએ સળંગ વીસ મેચ જીતી.

નિર્દેશક બેનેટ મિલરે ત્યારબાદ આ વાર્તાને સમર્પિત એક ફિલ્મ બનાવી - બ્રાડ પિટ અભિનીત “ધ મેન હુ ચેન્જ્ડ એવરીથિંગ”.

બિગ ડેટા ટેકનોલોજી નાણાકીય ક્ષેત્રમાં પણ ઉપયોગી છે. વિશ્વમાં એક પણ વ્યક્તિ સ્વતંત્ર અને સચોટ રીતે નક્કી કરી શકતી નથી કે તે કોઈને લોન આપવા યોગ્ય છે કે કેમ. નિર્ણય લેવા માટે, સ્કોરિંગ કરવામાં આવે છે, એટલે કે, એક સંભવિત મોડેલ બનાવવામાં આવે છે, જેમાંથી કોઈ સમજી શકે છે કે આ વ્યક્તિ પૈસા પરત કરશે કે નહીં. આગળ, સ્કોરિંગ તમામ તબક્કે લાગુ કરવામાં આવે છે: તમે, ઉદાહરણ તરીકે, ગણતરી કરી શકો છો કે કોઈ ચોક્કસ ક્ષણે વ્યક્તિ ચૂકવણી કરવાનું બંધ કરશે.

મોટા ડેટા તમને માત્ર પૈસા કમાવવા માટે જ નહીં, પણ તેને બચાવવા માટે પણ પરવાનગી આપે છે. ખાસ કરીને, આ તકનીકીએ જર્મન શ્રમ મંત્રાલયને બેરોજગારી લાભોની કિંમતમાં 10 બિલિયન યુરો ઘટાડવામાં મદદ કરી, કારણ કે માહિતીનું વિશ્લેષણ કર્યા પછી તે સ્પષ્ટ થયું કે 20% લાભો અયોગ્ય રીતે ચૂકવવામાં આવ્યા હતા.

ટેક્નોલોજીનો ઉપયોગ દવામાં પણ થાય છે (આ ખાસ કરીને ઇઝરાયેલ માટે લાક્ષણિક છે). બિગ ડેટાની મદદથી, તમે ત્રીસ વર્ષનો અનુભવ ધરાવતા ડૉક્ટર કરતાં વધુ સચોટ વિશ્લેષણ કરી શકો છો.

કોઈપણ ડૉક્ટર, નિદાન કરતી વખતે, ફક્ત તેના પોતાના અનુભવ પર આધાર રાખે છે. જ્યારે કોઈ મશીન આ કરે છે, ત્યારે તે આવા હજારો ડૉક્ટરો અને બધાના અનુભવમાંથી આવે છે હાલની વાર્તાઓરોગો તે ધ્યાનમાં લે છે કે દર્દીનું ઘર કઈ સામગ્રીથી બનેલું છે, પીડિત કયા વિસ્તારમાં રહે છે, ત્યાં કેવા પ્રકારનો ધુમાડો છે, વગેરે. એટલે કે, તે ઘણા બધા પરિબળોને ધ્યાનમાં લે છે જે ડોકટરો ધ્યાનમાં લેતા નથી.

હેલ્થકેરમાં બિગ ડેટાના ઉપયોગનું ઉદાહરણ પ્રોજેક્ટ આર્ટેમિસ પ્રોજેક્ટ છે, જેનો અમલ ટોરોન્ટો ચિલ્ડ્રન્સ હોસ્પિટલ દ્વારા કરવામાં આવ્યો હતો. આ એક માહિતી પ્રણાલી છે જે રીઅલ ટાઇમમાં બાળકોના ડેટાને એકત્ર કરે છે અને તેનું વિશ્લેષણ કરે છે. મશીન તમને દર સેકન્ડે દરેક બાળકના 1260 સ્વાસ્થ્ય સૂચકાંકોનું વિશ્લેષણ કરવાની મંજૂરી આપે છે. આ પ્રોજેક્ટનો હેતુ બાળકની અસ્થિર સ્થિતિની આગાહી કરવા અને બાળકોમાં થતા રોગોને રોકવાનો છે.

રશિયામાં મોટા ડેટાનો પણ ઉપયોગ થવાનું શરૂ થઈ રહ્યું છે: ઉદાહરણ તરીકે, યાન્ડેક્ષ પાસે મોટો ડેટા વિભાગ છે. કંપનીએ AstraZeneca અને રશિયન સોસાયટી ઓફ ક્લિનિકલ ઓન્કોલોજી RUSSCO સાથે મળીને RAY પ્લેટફોર્મ લોન્ચ કર્યું, જેનો હેતુ આનુવંશિક અને મોલેક્યુલર બાયોલોજીસ્ટ માટે છે. આ પ્રોજેક્ટ અમને કેન્સરનું નિદાન કરવા અને તેના માટેના વલણને ઓળખવા માટેની પદ્ધતિઓ સુધારવા માટે પરવાનગી આપે છે ઓન્કોલોજીકલ રોગો. આ પ્લેટફોર્મ ડિસેમ્બર 2016માં લોન્ચ થશે.

સંશોધન અને વલણોમાંથી સામગ્રી પર આધારિત

બિગ ડેટા ઘણા વર્ષોથી આઇટી અને માર્કેટિંગ પ્રેસની ચર્ચા છે. અને તે સ્પષ્ટ છે: ડિજિટલ ટેક્નોલોજીએ જીવનમાં પ્રવેશ કર્યો છે આધુનિક માણસ, "બધું લખાયેલું છે." જીવનના વિવિધ પાસાઓ પરના ડેટાનું પ્રમાણ વધી રહ્યું છે, અને તે જ સમયે માહિતી સંગ્રહિત કરવાની શક્યતાઓ વધી રહી છે.

માહિતી સંગ્રહિત કરવા માટે વૈશ્વિક તકનીકો

સ્ત્રોત: હિલ્બર્ટ અને લોપેઝ, `ધ વર્લ્ડસ ટેક્નોલોજીકલ કેપેસિટી ટુ સ્ટોર, કોમ્યુનિકેટ અને કમ્પ્યુટ માહિતી,` સાયન્સ, 2011 ગ્લોબલ.

મોટાભાગના નિષ્ણાતો સંમત થાય છે કે ડેટા વૃદ્ધિને વેગ આપવો એ એક ઉદ્દેશ્ય વાસ્તવિકતા છે. સામાજિક નેટવર્ક્સ, મોબાઇલ ઉપકરણો, માપન ઉપકરણોમાંથી ડેટા, વ્યવસાય માહિતી - આ માત્ર થોડા પ્રકારના સ્ત્રોતો છે જે માહિતીના વિશાળ વોલ્યુમો પેદા કરી શકે છે. અભ્યાસ મુજબ IDCડિજિટલ બ્રહ્માંડ, 2012 માં પ્રકાશિત, આગામી 8 વર્ષમાં વિશ્વમાં ડેટાનો જથ્થો 40 ZB (ઝેટાબાઇટ્સ) સુધી પહોંચશે, જે ગ્રહના દરેક રહેવાસી માટે 5200 GB ની સમકક્ષ છે.

યુએસમાં ડિજિટલ માહિતી સંગ્રહની વૃદ્ધિ


સ્ત્રોત: IDC

મોટાભાગની માહિતી લોકો દ્વારા નહીં, પરંતુ રોબોટ્સ દ્વારા એકબીજા સાથે અને અન્ય ડેટા નેટવર્ક્સ, જેમ કે સેન્સર અને સ્માર્ટ ઉપકરણો બંને સાથે ક્રિયાપ્રતિક્રિયા કરીને બનાવવામાં આવે છે. વૃદ્ધિના આ દરે, સંશોધકોના મતે, વિશ્વમાં ડેટાની માત્રા દર વર્ષે બમણી થશે. નવા ડેટા સેન્ટરોના વિસ્તરણ અને નિર્માણને કારણે વિશ્વમાં વર્ચ્યુઅલ અને ભૌતિક સર્વરની સંખ્યા દસ ગણી વધશે. પરિણામે, આ ડેટાનો અસરકારક રીતે ઉપયોગ અને મુદ્રીકરણ કરવાની જરૂરિયાત વધી રહી છે. વ્યવસાયમાં બિગ ડેટાનો ઉપયોગ કરવા માટે નોંધપાત્ર રોકાણની જરૂર હોવાથી, તમારે પરિસ્થિતિને સ્પષ્ટપણે સમજવાની જરૂર છે. અને તે સારમાં, સરળ છે: તમે ખર્ચ ઘટાડીને અને/અથવા વેચાણની માત્રા વધારીને વ્યવસાયની કાર્યક્ષમતા વધારી શકો છો.

આપણને મોટા ડેટાની કેમ જરૂર છે?

બિગ ડેટા પેરાડાઈમ ત્રણ મુખ્ય પ્રકારની સમસ્યાઓને વ્યાખ્યાયિત કરે છે.

  • સેંકડો ટેરાબાઇટ અથવા પેટાબાઇટ્સના ડેટા વોલ્યુમોને સંગ્રહિત અને મેનેજ કરવું, જે લાક્ષણિક છે રિલેશનલ ડેટાબેસેસડેટાનો અસરકારક ઉપયોગ કરી શકાતો નથી.
  • ગ્રંથો, છબીઓ, વિડિયો અને અન્ય પ્રકારના ડેટાનો સમાવેશ કરતી અસંગઠિત માહિતી ગોઠવો.
  • બિગ ડેટા પૃથ્થકરણ, જે અસંગઠિત માહિતી સાથે કામ કરવાની રીતો, વિશ્લેષણાત્મક અહેવાલોનું નિર્માણ, તેમજ અનુમાનિત મોડલના અમલીકરણનો પ્રશ્ન ઊભો કરે છે.

બિગ ડેટા પ્રોજેક્ટ માર્કેટ બિઝનેસ એનાલિટિક્સ (BA) માર્કેટ સાથે છેદે છે, જેનું વૈશ્વિક વોલ્યુમ, નિષ્ણાતોના મતે, 2012 માં આશરે $100 બિલિયન જેટલું હતું. તેમાં નેટવર્ક ટેક્નોલોજીના ઘટકો, સર્વર્સ, સોફ્ટવેરઅને તકનીકી સેવાઓ.

ઉપરાંત, બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ કંપનીઓની પ્રવૃત્તિઓને સ્વચાલિત કરવા માટે રચાયેલ આવક ખાતરી (RA) વર્ગ ઉકેલો માટે સુસંગત છે. આધુનિક સિસ્ટમોઆવકની બાંયધરીઓમાં વિસંગતતાઓ શોધવા માટેના સાધનો અને ઊંડાણપૂર્વકના ડેટા વિશ્લેષણનો સમાવેશ થાય છે, જે નાણાકીય પરિણામોમાં ઘટાડો તરફ દોરી શકે તેવા સંભવિત નુકસાન અથવા માહિતીના વિકૃતિને સમયસર શોધવાની મંજૂરી આપે છે. આ પૃષ્ઠભૂમિની સામે, રશિયન કંપનીઓ, સ્થાનિક બજારમાં બિગ ડેટા ટેક્નોલોજીની માંગની હાજરીની પુષ્ટિ કરતી, નોંધ લે છે કે રશિયામાં બિગ ડેટાના વિકાસને ઉત્તેજન આપતા પરિબળો ડેટા વૃદ્ધિ, મેનેજમેન્ટ નિર્ણય લેવાની ગતિ અને તેમની ગુણવત્તામાં સુધારો છે.

તમને બિગ ડેટા સાથે કામ કરવાથી શું અટકાવે છે

આજે, માત્ર 0.5% સંચિત ડિજિટલ ડેટાનું વિશ્લેષણ કરવામાં આવે છે, તે હકીકત હોવા છતાં કે ઉદ્યોગ-વ્યાપી સમસ્યાઓ છે જે બિગ ડેટા વર્ગના વિશ્લેષણાત્મક ઉકેલોનો ઉપયોગ કરીને ઉકેલી શકાય છે. વિકસિત IT બજારોમાં પહેલાથી જ એવા પરિણામો છે જેનો ઉપયોગ મોટા ડેટાના સંચય અને પ્રક્રિયા સાથે સંકળાયેલ અપેક્ષાઓનું મૂલ્યાંકન કરવા માટે થઈ શકે છે.

બિગ ડેટા પ્રોજેક્ટ્સના અમલીકરણને ધીમું પાડતા મુખ્ય પરિબળો પૈકી એક, ઊંચી કિંમત ઉપરાંત, ગણવામાં આવે છે. પ્રોસેસ્ડ ડેટા પસંદ કરવામાં સમસ્યા: એટલે કે, કયા ડેટાને પુનઃપ્રાપ્ત, સંગ્રહિત અને વિશ્લેષણ કરવાની જરૂર છે અને કયાને અવગણવા જોઈએ તે નક્કી કરવું.

ઘણા બિઝનેસ પ્રતિનિધિઓ નોંધે છે કે બિગ ડેટા પ્રોજેક્ટના અમલીકરણમાં મુશ્કેલીઓ નિષ્ણાતો - માર્કેટર્સ અને વિશ્લેષકોની અછત સાથે સંકળાયેલી છે. બિગ ડેટામાં રોકાણ પર વળતરની ઝડપ સીધી રીતે ઊંડાણપૂર્વક અને અનુમાનિત વિશ્લેષણમાં રોકાયેલા કર્મચારીઓના કામની ગુણવત્તા પર આધારિત છે. સંસ્થામાં પહેલાથી જ અસ્તિત્વમાં રહેલા ડેટાની પ્રચંડ સંભાવના ઘણી વખત જૂની વ્યવસાય પ્રક્રિયાઓ અથવા આંતરિક નિયમોને કારણે માર્કેટર્સ દ્વારા અસરકારક રીતે ઉપયોગમાં લઈ શકાતી નથી. તેથી, મોટા ડેટા પ્રોજેક્ટ્સને વ્યવસાયો દ્વારા માત્ર અમલમાં જ નહીં, પણ પરિણામોનું મૂલ્યાંકન કરવું પણ મુશ્કેલ માનવામાં આવે છે: એકત્રિત ડેટાનું મૂલ્ય. ડેટા સાથે કામ કરવાની વિશિષ્ટ પ્રકૃતિ માટે માર્કેટર્સ અને વિશ્લેષકોએ તેમનું ધ્યાન ટેક્નોલોજીથી ફેરવવું અને ચોક્કસ વ્યવસાય સમસ્યાઓ ઉકેલવા માટે રિપોર્ટ્સ બનાવવાની જરૂર છે.

ડેટાના પ્રવાહની મોટી માત્રા અને ઊંચી ઝડપને લીધે, ડેટા સંગ્રહની પ્રક્રિયામાં વાસ્તવિક સમયમાં ETL પ્રક્રિયાઓનો સમાવેશ થાય છે. જાણકારી માટે:ETL - થીઅંગ્રેજીઅર્ક, પરિવર્તન, લોડ- શાબ્દિક રીતે "એક્સ્ટ્રેક્ટિંગ, ટ્રાન્સફોર્મિંગ, લોડિંગ") - મેનેજમેન્ટની મુખ્ય પ્રક્રિયાઓમાંની એક ડેટા વેરહાઉસ, જેમાં નીચેનાનો સમાવેશ થાય છે: બાહ્ય સ્ત્રોતોમાંથી ડેટા નિષ્કર્ષણ, તેમનું પરિવર્તન અને જરૂરિયાતો પૂરી કરવા માટે સફાઈ ETL ને માત્ર એક એપ્લિકેશનમાંથી બીજી એપ્લિકેશનમાં ડેટા ખસેડવાની પ્રક્રિયા તરીકે જ નહીં, પણ વિશ્લેષણ માટે ડેટા તૈયાર કરવાના સાધન તરીકે પણ જોવું જોઈએ.

અને પછી બાહ્ય સ્ત્રોતોમાંથી આવતા ડેટાની સુરક્ષા સુનિશ્ચિત કરવાના મુદ્દાઓમાં એકત્રિત માહિતીના જથ્થાને અનુરૂપ ઉકેલો હોવા જોઈએ. ડેટાના જથ્થામાં વૃદ્ધિને પગલે જ બિગ ડેટા પૃથ્થકરણ પદ્ધતિઓનો વિકાસ થતો હોવાથી, ડેટા તૈયાર કરવા અને એકત્ર કરવાની નવી પદ્ધતિઓનો ઉપયોગ કરવા માટે વિશ્લેષણાત્મક પ્લેટફોર્મની ક્ષમતા મોટી ભૂમિકા ભજવે છે. આ સૂચવે છે કે, ઉદાહરણ તરીકે, સંભવિત ખરીદદારો વિશેનો ડેટા અથવા ઓનલાઈન શોપિંગ સાઇટ્સ પરના ક્લિક્સના ઈતિહાસ સાથેનો વિશાળ ડેટા વેરહાઉસ વિવિધ સમસ્યાઓના નિરાકરણ માટે રસ હોઈ શકે છે.

મુશ્કેલીઓ અટકતી નથી

બિગ ડેટાના અમલીકરણમાં તમામ મુશ્કેલીઓ હોવા છતાં, વ્યવસાય આ ક્ષેત્રમાં રોકાણ વધારવાનો ઇરાદો ધરાવે છે. ગાર્ટનરના ડેટા પરથી નીચે મુજબ, 2013 માં, વિશ્વની સૌથી મોટી કંપનીઓમાંથી 64% પહેલાથી જ રોકાણ કરી ચૂકી છે અથવા તેમના વ્યવસાય માટે બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ કરવા માટે રોકાણ કરવાની યોજના ધરાવે છે, જ્યારે 2012માં 58% હતી. ગાર્ટનર સંશોધન મુજબ, બિગ ડેટામાં રોકાણ કરનારા ઉદ્યોગોમાં અગ્રણી મીડિયા કંપનીઓ, ટેલિકોમ, બેંકિંગ અને સેવા કંપનીઓ છે. બિગ ડેટાના અમલીકરણના સફળ પરિણામો આ ક્ષેત્રમાં ઘણા મોટા ખેલાડીઓ દ્વારા પહેલાથી જ પ્રાપ્ત કરવામાં આવ્યા છે રિટેલરેડિયો ફ્રીક્વન્સી આઇડેન્ટિફિકેશન ટૂલ્સ, લોજિસ્ટિક્સ અને રિલોકેશન સિસ્ટમ્સનો ઉપયોગ કરીને મેળવેલા ડેટાના ઉપયોગ અંગે (અંગ્રેજીમાંથી. ફરી ભરવું- સંચય, ફરી ભરવું - આર એન્ડ ટી), તેમજ લોયલ્ટી પ્રોગ્રામ્સમાંથી. સફળ રિટેલ અનુભવ અન્ય બજાર ક્ષેત્રોને નવા શોધવા માટે પ્રોત્સાહિત કરે છે અસરકારક રીતોમોટા ડેટાનું મુદ્રીકરણ તેના વિશ્લેષણને એવા સંસાધનમાં ફેરવવા માટે કે જે વ્યવસાયના વિકાસ માટે કામ કરે છે. આને કારણે, નિષ્ણાતોના મતે, 2020 સુધીના સમયગાળામાં, મેનેજમેન્ટ અને સ્ટોરેજમાં રોકાણ પ્રતિ ગીગાબાઇટ ડેટા $2 થી ઘટીને $0.2 થશે, પરંતુ બિગ ડેટાના તકનીકી ગુણધર્મોના અભ્યાસ અને વિશ્લેષણ માટે માત્ર 40% નો વધારો થશે.

બિગ ડેટાના ક્ષેત્રમાં વિવિધ રોકાણ પ્રોજેક્ટ્સમાં પ્રસ્તુત ખર્ચ અલગ-અલગ પ્રકૃતિના હોય છે. કિંમતની વસ્તુઓ ચોક્કસ નિર્ણયોના આધારે પસંદ કરેલ ઉત્પાદનોના પ્રકારો પર આધારિત છે. નિષ્ણાતોના મતે રોકાણના પ્રોજેક્ટમાં ખર્ચનો સૌથી મોટો હિસ્સો સંગ્રહ, ડેટાનું માળખું, સફાઈ અને માહિતી વ્યવસ્થાપન સંબંધિત ઉત્પાદનો પર પડે છે.

તે કેવી રીતે થાય છે

સોફ્ટવેર અને હાર્ડવેરના ઘણા સંયોજનો છે જે તમને વિવિધ વ્યવસાયિક શાખાઓ માટે અસરકારક બિગ ડેટા સોલ્યુશન્સ બનાવવા દે છે: સોશિયલ મીડિયા અને મોબાઇલ એપ્લિકેશન્સ, બિઝનેસ ડેટા માઇનિંગ અને વિઝ્યુલાઇઝેશન માટે. બિગ ડેટાનો મહત્વનો ફાયદો એ છે કે બિઝનેસમાં વ્યાપકપણે ઉપયોગમાં લેવાતા ડેટાબેઝ સાથેના નવા ટૂલ્સની સુસંગતતા, જે ખાસ કરીને મલ્ટિ-ચેનલ વેચાણ અને ગ્રાહક સપોર્ટનું આયોજન કરવા જેવા ક્રોસ-ડિસિપ્લિનરી પ્રોજેક્ટ્સ સાથે કામ કરતી વખતે મહત્વપૂર્ણ છે.

બિગ ડેટા સાથે કામ કરવાના ક્રમમાં ડેટા એકત્રિત કરવાનો, રિપોર્ટ્સ અને ડેશબોર્ડ્સનો ઉપયોગ કરીને પ્રાપ્ત માહિતીનું માળખું, આંતરદૃષ્ટિ અને સંદર્ભો બનાવવા અને કાર્યવાહી માટે ભલામણો ઘડવાનો સમાવેશ થાય છે. બિગ ડેટા સાથે કામ કરવાથી ડેટા એકત્રિત કરવા માટે મોટા ખર્ચનો સમાવેશ થાય છે, જેની પ્રક્રિયાનું પરિણામ અગાઉથી અજ્ઞાત છે, મુખ્ય કાર્ય એ સ્પષ્ટપણે સમજવાનું છે કે ડેટા શેના માટે છે, અને તેમાંથી કેટલો જથ્થો ઉપલબ્ધ છે. આ કિસ્સામાં, ડેટા સંગ્રહ ચોક્કસ સમસ્યાઓ ઉકેલવા માટે ફક્ત જરૂરી માહિતી મેળવવાની પ્રક્રિયામાં ફેરવાય છે.

ઉદાહરણ તરીકે, ટેલિકોમ્યુનિકેશન પ્રદાતાઓ ભૌગોલિક સ્થાન સહિત વિશાળ માત્રામાં ડેટા એકત્ર કરે છે, જે સતત અપડેટ થાય છે. આ માહિતી જાહેરાત એજન્સીઓ માટે વ્યાપારી હિતની હોઈ શકે છે, જેઓ તેનો ઉપયોગ લક્ષિત અને સ્થાનિક જાહેરાતો તેમજ રિટેલર્સ અને બેંકોને પહોંચાડવા માટે કરી શકે છે. લોકોના શક્તિશાળી લક્ષિત પ્રવાહની હાજરી વિશેના ડેટાના આધારે ચોક્કસ સ્થાને રિટેલ આઉટલેટ ખોલવાનું નક્કી કરતી વખતે આવા ડેટા મહત્વપૂર્ણ ભૂમિકા ભજવી શકે છે. લંડનમાં આઉટડોર બિલબોર્ડ પર જાહેરાતની અસરકારકતાને માપવાનું એક ઉદાહરણ છે. હવે આવી જાહેરાતોની પહોંચ માત્ર બાજુમાં મૂકીને માપી શકાય છે જાહેરાત માળખાંખાસ ઉપકરણ ધરાવતા લોકો કે જે પસાર થનારાઓની ગણતરી કરે છે. આ પ્રકારની જાહેરાતની અસરકારકતાને માપવાની તુલનામાં, મોબાઇલ ઑપરેટર પાસે ઘણી વધુ તકો છે - તે તેના સબ્સ્ક્રાઇબર્સના સ્થાનને બરાબર જાણે છે, તે તેમની વસ્તી વિષયક લાક્ષણિકતાઓ, લિંગ, ઉંમર, વૈવાહિક સ્થિતિ વગેરે જાણે છે.

આવા ડેટાના આધારે, ભવિષ્યમાં બિલબોર્ડ પરથી પસાર થતી ચોક્કસ વ્યક્તિની પસંદગીઓનો ઉપયોગ કરીને જાહેરાત સંદેશની સામગ્રીને બદલવાની સંભાવના છે. જો ડેટા દર્શાવે છે કે ત્યાંથી પસાર થતી વ્યક્તિ ઘણી મુસાફરી કરે છે, તો તેને રિસોર્ટની જાહેરાત બતાવવામાં આવી શકે છે. ફૂટબોલ મેચના આયોજકો જ્યારે મેચમાં આવે ત્યારે જ ચાહકોની સંખ્યાનો અંદાજ લગાવી શકે છે. પરંતુ જો તેઓ તેમના મોબાઇલ ફોન પ્રદાતાને મેચના એક કલાક, એક દિવસ અથવા એક મહિના પહેલા મુલાકાતીઓ ક્યાં હતા તે વિશેની માહિતી માટે પૂછી શકે, તો તે આયોજકોને ભવિષ્યની મેચો માટે જાહેરાતના સ્થળોની યોજના કરવાની ક્ષમતા આપશે.

બીજું ઉદાહરણ એ છે કે બેંકો છેતરપિંડી અટકાવવા બિગ ડેટાનો ઉપયોગ કેવી રીતે કરી શકે છે. જો ક્લાયન્ટ કાર્ડ ખોવાઈ જવાની જાણ કરે છે, અને તેની સાથે ખરીદી કરતી વખતે, બેંક રિયલ ટાઈમમાં ગ્રાહકના ફોનનું સ્થાન ખરીદના ક્ષેત્રમાં જુએ છે જ્યાં ટ્રાન્ઝેક્શન થાય છે, તો બેંક ક્લાયન્ટની એપ્લિકેશન પરની માહિતી ચકાસી શકે છે. તે જોવા માટે કે શું તે તેને છેતરવાનો પ્રયાસ કરી રહ્યો છે. અથવા વિપરીત પરિસ્થિતિ, જ્યારે કોઈ ક્લાયંટ સ્ટોરમાં ખરીદી કરે છે, ત્યારે બેંક જુએ છે કે વ્યવહાર માટે વપરાયેલ કાર્ડ અને ક્લાયંટનો ફોન એક જ જગ્યાએ છે, બેંક નિષ્કર્ષ પર આવી શકે છે કે કાર્ડ માલિક તેનો ઉપયોગ કરી રહ્યો છે. બિગ ડેટાના આવા ફાયદાઓ માટે આભાર, પરંપરાગત ડેટા વેરહાઉસની સીમાઓ વિસ્તૃત થઈ રહી છે.

બિગ ડેટા સોલ્યુશન્સનો સફળતાપૂર્વક અમલ કરવાનો નિર્ણય લેવા માટે, કંપનીએ રોકાણના કેસની ગણતરી કરવાની જરૂર છે, અને આ ઘણા અજાણ્યા ઘટકોને કારણે મોટી મુશ્કેલીઓનું કારણ બને છે. આવા કિસ્સાઓમાં વિશ્લેષણનો વિરોધાભાસ ભૂતકાળના આધારે ભવિષ્યની આગાહી કરે છે, જેના વિશેનો ડેટા ઘણીવાર ખૂટે છે. આ કિસ્સામાં, એક મહત્વપૂર્ણ પરિબળ તમારી પ્રારંભિક ક્રિયાઓનું સ્પષ્ટ આયોજન છે:

  • પ્રથમ, એક વિશિષ્ટ વ્યવસાય સમસ્યા નક્કી કરવી જરૂરી છે જેના માટે બિગ ડેટા તકનીકોનો ઉપયોગ કરવામાં આવશે; આ કાર્ય પસંદ કરેલ ખ્યાલની શુદ્ધતા નક્કી કરવા માટેનું મુખ્ય બનશે. તમારે આ વિશિષ્ટ કાર્યથી સંબંધિત ડેટા એકત્રિત કરવા પર ધ્યાન કેન્દ્રિત કરવાની જરૂર છે, અને ખ્યાલના પુરાવા દરમિયાન, તમે વિવિધ સાધનો, પ્રક્રિયાઓ અને વ્યવસ્થાપન તકનીકોનો ઉપયોગ કરી શકો છો જે તમને ભવિષ્યમાં વધુ જાણકાર નિર્ણયો લેવાની મંજૂરી આપશે.
  • બીજું, ડેટા એનાલિટિક્સ કૌશલ્ય અને અનુભવ વિનાની કંપની બિગ ડેટા પ્રોજેક્ટને સફળતાપૂર્વક અમલમાં મૂકી શકશે તેવી શક્યતા નથી. જરૂરી જ્ઞાન હંમેશા અગાઉના એનાલિટિક્સ અનુભવમાંથી ઉત્પન્ન થાય છે, જે ડેટા સાથે કામ કરવાની ગુણવત્તાને પ્રભાવિત કરતું મુખ્ય પરિબળ છે. ડેટા કલ્ચર મહત્વપૂર્ણ છે કારણ કે ઘણી વખત ડેટા વિશ્લેષણ વ્યવસાય વિશેના કઠણ સત્યો દર્શાવે છે, અને તે સત્યોને સ્વીકારવા અને તેની સાથે કામ કરવા માટે ડેટા પ્રેક્ટિસ લે છે.
  • ત્રીજું, બિગ ડેટા ટેક્નોલોજીનું મૂલ્ય આંતરદૃષ્ટિ પ્રદાન કરવામાં આવેલું છે. બજારમાં સારા વિશ્લેષકોનો પુરવઠો ઓછો રહે છે. તેમને સામાન્ય રીતે નિષ્ણાતો કહેવામાં આવે છે જેઓ ડેટાના વ્યાપારી અર્થની ઊંડી સમજ ધરાવે છે અને તેનો યોગ્ય રીતે ઉપયોગ કેવી રીતે કરવો તે જાણે છે. ડેટા વિશ્લેષણ એ વ્યવસાયિક લક્ષ્યો હાંસલ કરવા માટેનું એક માધ્યમ છે, અને બિગ ડેટાના મૂલ્યને સમજવા માટે, તમારે તે મુજબ વર્તવું અને તમારી ક્રિયાઓને સમજવાની જરૂર છે. આ કિસ્સામાં, મોટા ડેટા ઘણું પ્રદાન કરશે ઉપયોગી માહિતીગ્રાહકો વિશે, જેના આધારે વ્યવસાય માટે ઉપયોગી એવા નિર્ણયો લઈ શકાય.

હકીકત એ છે કે રશિયન બિગ ડેટા માર્કેટ માત્ર આકાર લેવાનું શરૂ કરી રહ્યું છે તે છતાં, આ ક્ષેત્રમાં વ્યક્તિગત પ્રોજેક્ટ્સ પહેલેથી જ સફળતાપૂર્વક અમલમાં મૂકાઈ રહ્યા છે. તેમાંના કેટલાક ડેટા સંગ્રહના ક્ષેત્રમાં સફળ છે, જેમ કે ફેડરલ ટેક્સ સર્વિસ અને ટિંકઓફ ક્રેડિટ સિસ્ટમ્સ બેંક માટેના પ્રોજેક્ટ્સ, અન્ય - ડેટા વિશ્લેષણ અને તેના પરિણામોની વ્યવહારિક એપ્લિકેશનના સંદર્ભમાં: આ સિંકેરા પ્રોજેક્ટ છે.

Tinkoff ક્રેડિટ સિસ્ટમ્સ બેંકે EMC2 ગ્રીનપ્લમ પ્લેટફોર્મનો અમલ કરવા માટે એક પ્રોજેક્ટ અમલમાં મૂક્યો છે, જે મોટા પાયે સમાંતર કમ્પ્યુટિંગ માટેનું એક સાધન છે. દરમિયાન તાજેતરના વર્ષોક્રેડિટ કાર્ડ વપરાશકર્તાઓની સંખ્યાના ઊંચા વૃદ્ધિ દરને કારણે બેંકે સંચિત માહિતીની પ્રક્રિયાની ઝડપ અને વાસ્તવિક સમયમાં ડેટાનું વિશ્લેષણ કરવાની જરૂરિયાતો વધારી છે. બેંકે બિગ ડેટા ટેક્નોલોજીના ઉપયોગને વિસ્તૃત કરવાની યોજના જાહેર કરી છે, ખાસ કરીને અનસ્ટ્રક્ચર્ડ ડેટાની પ્રક્રિયા કરવા અને વિવિધ સ્ત્રોતોમાંથી પ્રાપ્ત કોર્પોરેટ માહિતી સાથે કામ કરવા માટે.

રશિયાની ફેડરલ ટેક્સ સર્વિસ હાલમાં ફેડરલ ડેટા વેરહાઉસ માટે વિશ્લેષણાત્મક સ્તર બનાવી રહી છે. તેના આધારે, આંકડાકીય અને વિશ્લેષણાત્મક પ્રક્રિયા માટે ટેક્સ ડેટાને ઍક્સેસ કરવા માટે એકીકૃત માહિતી જગ્યા અને તકનીક બનાવવામાં આવે છે. પ્રોજેક્ટના અમલીકરણ દરમિયાન, ફેડરલ ટેક્સ સર્વિસના સ્થાનિક સ્તરે 1,200 થી વધુ સ્ત્રોતોમાંથી વિશ્લેષણાત્મક માહિતીને કેન્દ્રિય બનાવવાનું કાર્ય હાથ ધરવામાં આવી રહ્યું છે.

વાસ્તવિક સમયમાં મોટા ડેટા વિશ્લેષણનું બીજું રસપ્રદ ઉદાહરણ રશિયન સ્ટાર્ટઅપ સિંકેરા છે, જેણે સિમ્પલેટ પ્લેટફોર્મ વિકસાવ્યું હતું. સોલ્યુશન મોટી માત્રામાં ડેટાની પ્રક્રિયા પર આધારિત છે; પ્રોગ્રામ ગ્રાહકો વિશેની માહિતી, તેમની ખરીદીનો ઇતિહાસ, ઉંમર, લિંગ અને મૂડનું વિશ્લેષણ કરે છે. કોસ્મેટિક્સ સ્ટોર્સની સાંકળમાં ચેકઆઉટ વખતે ગ્રાહકની લાગણીઓને ઓળખતા સેન્સર સાથેની ટચ સ્ક્રીન ઇન્સ્ટોલ કરવામાં આવી હતી. પ્રોગ્રામ વ્યક્તિના મૂડને નિર્ધારિત કરે છે, તેના વિશેની માહિતીનું વિશ્લેષણ કરે છે, દિવસનો સમય નક્કી કરે છે અને સ્ટોરના ડિસ્કાઉન્ટ ડેટાબેઝને સ્કેન કરે છે, ત્યારબાદ તે ખરીદનારને પ્રમોશન અને વિશેષ ઑફર્સ વિશે લક્ષિત સંદેશા મોકલે છે. આ સોલ્યુશન ગ્રાહકોની વફાદારી વધારે છે અને રિટેલર્સનું વેચાણ વધારે છે.

જો આપણે વિદેશી સફળ કિસ્સાઓ વિશે વાત કરીએ, તો ઉત્પાદનો વેચવા માટે રીઅલ-ટાઇમ ડેટાનો ઉપયોગ કરતી Dunkin`Donuts કંપનીમાં બિગ ડેટા ટેક્નોલોજીનો ઉપયોગ કરવાનો અનુભવ આ સંદર્ભમાં રસપ્રદ છે. સ્ટોર્સમાં ડિજિટલ ડિસ્પ્લે ઑફર્સ દર્શાવે છે જે દિવસના સમય અને ઉત્પાદનની ઉપલબ્ધતાના આધારે દર મિનિટે બદલાય છે. રોકડ રસીદોનો ઉપયોગ કરીને, કંપની ડેટા મેળવે છે કે જેના પર ગ્રાહકો તરફથી સૌથી વધુ પ્રતિસાદ મળે છે. આ ડેટા પ્રોસેસિંગ અભિગમથી અમને નફો અને વેરહાઉસમાં માલનું ટર્નઓવર વધારવાની મંજૂરી મળી.

બિગ ડેટા પ્રોજેક્ટના અમલીકરણનો અનુભવ બતાવે છે તેમ, આ વિસ્તાર આધુનિક વ્યવસાયિક સમસ્યાઓને સફળતાપૂર્વક ઉકેલવા માટે રચાયેલ છે. તે જ સમયે, મોટા ડેટા સાથે કામ કરતી વખતે વાણિજ્યિક ધ્યેયો હાંસલ કરવા માટે એક મહત્વપૂર્ણ પરિબળ એ યોગ્ય વ્યૂહરચના પસંદ કરવાનું છે, જેમાં ઉપભોક્તા વિનંતીઓ તેમજ ઉપયોગને ઓળખતા વિશ્લેષણનો સમાવેશ થાય છે. નવીન તકનીકોબિગ ડેટાના ક્ષેત્રમાં.

કોર્પોરેટ માર્કેટર્સ વચ્ચે 2012 થી Econsultancy અને Adobe દ્વારા વાર્ષિક ધોરણે હાથ ધરવામાં આવતા વૈશ્વિક સર્વે અનુસાર, "બિગ ડેટા" કે જે ઇન્ટરનેટ પર લોકોની ક્રિયાઓની લાક્ષણિકતા દર્શાવે છે તે ઘણું કરી શકે છે. તેઓ ઑફલાઇન વ્યવસાય પ્રક્રિયાઓને ઑપ્ટિમાઇઝ કરી શકે છે, માહિતી શોધવા માટે મોબાઇલ ઉપકરણોના માલિકો તેનો ઉપયોગ કેવી રીતે કરે છે તે સમજવામાં મદદ કરી શકે છે, અથવા ફક્ત "માર્કેટિંગને બહેતર બનાવી શકે છે," એટલે કે. વધુ કાર્યક્ષમ. તદુપરાંત, પછીનું કાર્ય વર્ષ-દર-વર્ષે વધુને વધુ લોકપ્રિય બની રહ્યું છે, અમે પ્રસ્તુત કરેલ આકૃતિમાંથી નીચે મુજબ છે.

ગ્રાહક સંબંધોના સંદર્ભમાં ઇન્ટરનેટ માર્કેટર્સના કાર્યના મુખ્ય ક્ષેત્રો


સ્ત્રોત: Econsultancy અને Adobe, પ્રકાશિત– emarketer.com

નોંધ કરો કે ઉત્તરદાતાઓની રાષ્ટ્રીયતા મહાન મહત્વપાસે નથી. 2013 માં કેપીએમજી દ્વારા હાથ ધરવામાં આવેલા સર્વે મુજબ, "આશાવાદીઓ" નો હિસ્સો, એટલે કે. જેઓ બિઝનેસ વ્યૂહરચના વિકસાવતી વખતે બિગ ડેટાનો ઉપયોગ કરે છે તેમની સંખ્યા 56% છે, અને પ્રદેશ-પ્રાંતમાં ભિન્નતા ઓછી છે: ઉત્તર અમેરિકન દેશોમાં 63% થી EMEA માં 50%.

વિશ્વના વિવિધ પ્રદેશોમાં બિગ ડેટાનો ઉપયોગ


સ્ત્રોત: KPMG, પ્રકાશિત– emarketer.com

દરમિયાન, આવા "ફેશન વલણો" પ્રત્યે માર્કેટર્સનું વલણ કંઈક અંશે જાણીતા મજાકની યાદ અપાવે છે:

મને કહો, વનો, તને ટામેટાં ગમે છે?
- મને ખાવાનું ગમે છે, પણ આના જેવું નથી.

માર્કેટર્સ મૌખિક રીતે બિગ ડેટાને "પ્રેમ" કરે છે અને તેનો ઉપયોગ કરે છે તેવું લાગે છે તે હકીકત હોવા છતાં, વાસ્તવિકતામાં, "બધું જટિલ છે," કારણ કે તેઓ સોશિયલ નેટવર્ક પર તેમના હૃદયપૂર્વકના પ્રેમ વિશે લખે છે.

યુરોપીયન માર્કેટર્સ વચ્ચે જાન્યુઆરી 2014 માં સર્કલ રિસર્ચ દ્વારા હાથ ધરવામાં આવેલા સર્વેક્ષણ મુજબ, 5 માંથી 4 ઉત્તરદાતાઓ બિગ ડેટાનો ઉપયોગ કરતા નથી (જો કે તેઓ, અલબત્ત, "તેને પસંદ કરે છે"). કારણો અલગ છે. ત્યાં બહુ ઓછા સંશયવાદીઓ છે - 17% અને તેમના એન્ટિપોડ્સ જેટલી જ સંખ્યા, એટલે કે. જેઓ વિશ્વાસપૂર્વક જવાબ આપે છે: "હા." બાકીના અચકાતા અને શંકાશીલ છે, “સ્વેમ્પ”. તેઓ બુદ્ધિગમ્ય બહાના હેઠળ સીધો જવાબ આપવાનું ટાળે છે જેમ કે "હજુ સુધી નથી, પરંતુ ટૂંક સમયમાં" અથવા "અન્ય શરૂ થાય ત્યાં સુધી અમે રાહ જોઈશું."

માર્કેટર્સ દ્વારા બિગ ડેટાનો ઉપયોગ, યુરોપ, જાન્યુઆરી 2014


સ્ત્રોત:dnx, પ્રકાશિત -ઈમાર્કેટરકોમ

શું તેમને મૂંઝવણમાં મૂકે છે? શુદ્ધ નોનસેન્સ. કેટલાક (તેમાંથી બરાબર અડધા) ફક્ત આ ડેટા પર વિશ્વાસ કરતા નથી. અન્ય લોકો (તેમાંના ઘણા બધા છે - 55%) "ડેટા" અને "વપરાશકર્તાઓ" ના સેટને એકબીજા સાથે સહસંબંધિત કરવાનું મુશ્કેલ લાગે છે. કેટલાક લોકો પાસે આંતરિક કોર્પોરેટ ગડબડ છે (રાજકીય રીતે યોગ્ય રીતે) અન્ય લોકો માટે, સૉફ્ટવેર કામના પ્રવાહનો સામનો કરી શકતું નથી. અને તેથી વધુ. કુલ શેર નોંધપાત્ર રીતે 100% કરતાં વધી ગયા હોવાથી, તે સ્પષ્ટ છે કે "બહુવિધ અવરોધો" ની પરિસ્થિતિ અસામાન્ય નથી.

માર્કેટિંગમાં બિગ ડેટાના ઉપયોગ માટે અવરોધો


સ્ત્રોત:dnx, પ્રકાશિત -ઈમાર્કેટરકોમ

આમ, આપણે સ્વીકારવું પડશે કે અત્યારે "બિગ ડેટા" એ એક મોટી સંભાવના છે જેનો લાભ લેવાની જરૂર છે. બાય ધ વે, આ કારણ હોઈ શકે છે કે બિગ ડેટા "ફેશનેબલ ટ્રેન્ડ"નો પોતાનો પ્રભામંડળ ગુમાવી રહ્યો છે, જેમ કે કંપની ઈકોન્સલ્ટન્સી દ્વારા હાથ ધરવામાં આવેલા સર્વેક્ષણ દ્વારા પુરાવા મળે છે, જેનો અમે ઉલ્લેખ કર્યો છે.

ડિજિટલ માર્કેટિંગ 2013-2014 માં સૌથી નોંધપાત્ર વલણો


સ્ત્રોત: ઇકોન્સલ્ટન્સી અને એડોબ

તેઓને અન્ય રાજા - સામગ્રી માર્કેટિંગ દ્વારા બદલવામાં આવી રહ્યા છે. કેટલુ લાંબુ?

એવું કહી શકાય નહીં કે બિગ ડેટા એ અમુક પ્રકારની મૂળભૂત રીતે નવી ઘટના છે. ડેટાના મોટા સ્ત્રોત ઘણા વર્ષોથી અસ્તિત્વમાં છે: ગ્રાહકની ખરીદી, ક્રેડિટ ઇતિહાસ, જીવનશૈલી પરના ડેટાબેઝ. અને વર્ષોથી, વૈજ્ઞાનિકોએ આ ડેટાનો ઉપયોગ કંપનીઓને જોખમનું મૂલ્યાંકન કરવામાં અને ભાવિ ગ્રાહક જરૂરિયાતોની આગાહી કરવામાં મદદ કરવા માટે કર્યો છે. જો કે, આજે પરિસ્થિતિ બે પાસાઓમાં બદલાઈ છે:

વિવિધ ડેટા સેટ્સનું વિશ્લેષણ અને સંયોજન કરવા માટે વધુ આધુનિક સાધનો અને તકનીકો ઉભરી આવ્યા છે;

આ વિશ્લેષણાત્મક સાધનો વર્ચ્યુઅલ રીતે તમામ ડેટા સંગ્રહ અને માપન પદ્ધતિઓના ડિજિટલાઇઝેશન દ્વારા સંચાલિત નવા ડેટા સ્ત્રોતોના હિમપ્રપાત દ્વારા પૂરક છે.

સંરચિત સંશોધન વાતાવરણમાં ઉછરેલા સંશોધકો માટે ઉપલબ્ધ માહિતીની શ્રેણી પ્રેરણાદાયી અને ભયાવહ બંને છે. ઉપભોક્તા સેન્ટિમેન્ટ વેબસાઇટ્સ અને તમામ પ્રકારના સોશિયલ મીડિયા દ્વારા કબજે કરવામાં આવે છે. જાહેરાત જોવાની હકીકત ફક્ત સેટ-ટોપ બોક્સ દ્વારા જ નહીં, પણ ડિજિટલ ટેગની મદદથી પણ રેકોર્ડ કરવામાં આવે છે અને મોબાઇલ ઉપકરણોટીવી સાથે વાતચીત.

બિહેવિયરલ ડેટા (જેમ કે કૉલ વોલ્યુમ, શોપિંગ ટેવ અને ખરીદી) હવે રીઅલ ટાઇમમાં ઉપલબ્ધ છે. આમ, સંશોધન દ્વારા અગાઉ જે મેળવી શકાતું હતું તેમાંથી ઘણું બધું હવે મોટા ડેટા સ્ત્રોતોનો ઉપયોગ કરીને શીખી શકાય છે. અને આ બધી માહિતી સંપત્તિઓ કોઈપણ સંશોધન પ્રક્રિયાઓને ધ્યાનમાં લીધા વિના સતત જનરેટ થાય છે. આ ફેરફારો અમને આશ્ચર્ય કરે છે કે શું મોટા ડેટા ક્લાસિક માર્કેટ રિસર્ચને બદલી શકે છે.

તે ડેટા વિશે નથી, તે પ્રશ્નો અને જવાબો વિશે છે.

ક્લાસિક સંશોધન માટે આપણે મૃત્યુની ઘંટડી વગાડીએ તે પહેલાં, આપણે આપણી જાતને યાદ અપાવવી જોઈએ કે તે ચોક્કસ ડેટા સંપત્તિની હાજરી નથી જે મહત્વપૂર્ણ છે, પરંતુ કંઈક બીજું છે. બરાબર શું? પ્રશ્નોના જવાબ આપવાની અમારી ક્ષમતા, તે જ છે. મોટા ડેટાની નવી દુનિયા વિશે એક રમુજી બાબત એ છે કે નવી ડેટા સંપત્તિઓમાંથી મેળવેલા પરિણામો હજી વધુ પ્રશ્નો તરફ દોરી જાય છે, અને આ પ્રશ્નોના સામાન્ય રીતે પરંપરાગત સંશોધન દ્વારા શ્રેષ્ઠ જવાબ આપવામાં આવે છે. આમ, જેમ જેમ મોટો ડેટા વધતો જાય છે તેમ તેમ આપણે "સ્મોલ ડેટા" ની ઉપલબ્ધતા અને જરૂરિયાતમાં સમાંતર વધારો જોઈએ છીએ જે મોટા ડેટાની દુનિયાના પ્રશ્નોના જવાબો આપી શકે છે.

પરિસ્થિતિને ધ્યાનમાં લો: એક મોટો જાહેરાતકર્તા રીઅલ ટાઇમમાં સ્ટોર ટ્રાફિક અને વેચાણની માત્રાનું સતત નિરીક્ષણ કરે છે. હાલની સંશોધન પદ્ધતિઓ (જેમાં અમે પેનલના સભ્યોને તેમની ખરીદીની પ્રેરણા અને પોઈન્ટ-ઓફ-સેલ વર્તણૂક વિશે સર્વેક્ષણ કરીએ છીએ) અમને ચોક્કસ ખરીદદાર સેગમેન્ટને વધુ સારી રીતે લક્ષિત કરવામાં મદદ કરે છે. આ તકનીકોને મોટી માહિતી સંપત્તિની વિશાળ શ્રેણીને સમાવવા માટે વિસ્તૃત કરી શકાય છે, જ્યાં સુધી મોટા ડેટા નિષ્ક્રિય અવલોકનનું સાધન બની જાય છે, અને સંશોધન અભ્યાસની જરૂર હોય તેવા ફેરફારો અથવા ઘટનાઓની ચાલુ, સંકુચિત રીતે કેન્દ્રિત તપાસની પદ્ધતિ બની જાય છે. આ રીતે મોટા ડેટા સંશોધનને બિનજરૂરી રૂટિનમાંથી મુક્ત કરી શકે છે. પ્રાથમિક સંશોધન હવે શું થઈ રહ્યું છે તેના પર ધ્યાન કેન્દ્રિત કરવાની જરૂર નથી (મોટો ડેટા તે કરશે). તેના બદલે, પ્રાથમિક સંશોધન એ સમજાવવા પર ધ્યાન કેન્દ્રિત કરી શકે છે કે આપણે ચોક્કસ વલણો અથવા વલણોમાંથી વિચલનો શા માટે અવલોકન કરીએ છીએ. સંશોધક ડેટા મેળવવા વિશે ઓછું અને તેનું વિશ્લેષણ અને ઉપયોગ કેવી રીતે કરવું તે વિશે વધુ વિચારી શકશે.

તે જ સમયે, આપણે જોઈએ છીએ કે મોટો ડેટા આપણી સૌથી મોટી સમસ્યાઓમાંથી એકને હલ કરી શકે છે: વધુ પડતા લાંબા અભ્યાસની સમસ્યા. અધ્યયનોની જાતે જ તપાસ કરવાથી જાણવા મળ્યું છે કે વધુ પડતાં સંશોધન સાધનો ડેટાની ગુણવત્તા પર નકારાત્મક અસર કરે છે. જો કે ઘણા નિષ્ણાતોએ આ સમસ્યાને લાંબા સમયથી સ્વીકારી હતી, તેઓ હંમેશા આ વાક્ય સાથે પ્રતિભાવ આપતા હતા, "પરંતુ મને વરિષ્ઠ મેનેજમેન્ટ માટે આ માહિતીની જરૂર છે," અને લાંબી મુલાકાતો ચાલુ રહી.

મોટા ડેટાની દુનિયામાં, જ્યાં નિષ્ક્રિય અવલોકન દ્વારા માત્રાત્મક મેટ્રિક્સ મેળવી શકાય છે, આ મુદ્દો વિવાદાસ્પદ બની જાય છે. ફરીથી, ચાલો વપરાશ સંબંધિત આ બધા અભ્યાસો વિશે વિચારીએ. જો મોટા ડેટા અમને નિષ્ક્રિય અવલોકન દ્વારા વપરાશની સમજ આપે છે, તો પછી પ્રાથમિક સર્વેક્ષણ સંશોધનને હવે આ પ્રકારની માહિતી એકત્રિત કરવાની જરૂર નથી, અને અમે આખરે ઇચ્છાપૂર્ણ વિચારસરણી કરતાં વધુ કંઈક સાથે ટૂંકા સર્વેક્ષણની અમારી દ્રષ્ટિનું સમર્થન કરી શકીએ છીએ.

બિગ ડેટાને તમારી મદદની જરૂર છે

છેવટે, "મોટા" એ મોટા ડેટાની માત્ર એક લાક્ષણિકતા છે. લાક્ષણિકતા "મોટા" ડેટાના કદ અને સ્કેલનો સંદર્ભ આપે છે. અલબત્ત, આ મુખ્ય લાક્ષણિકતા છે, કારણ કે આ ડેટાનું પ્રમાણ આપણે પહેલાં જે પણ કામ કર્યું છે તેનાથી આગળ છે. પરંતુ આ નવા ડેટા સ્ટ્રીમ્સની અન્ય વિશેષતાઓ પણ મહત્વપૂર્ણ છે: તે ઘણીવાર ખરાબ રીતે ફોર્મેટ કરેલ, અસંગઠિત (અથવા શ્રેષ્ઠ રીતે, આંશિક રીતે સંરચિત) અને અનિશ્ચિતતાથી ભરેલી હોય છે. ડેટા મેનેજમેન્ટનું એક ઉભરતું ક્ષેત્ર, યોગ્ય રીતે નામવાળી એન્ટિટી એનાલિટિક્સ, મોટા ડેટામાં અવાજને ઘટાડવાની સમસ્યાને સંબોધિત કરે છે. તેનું કામ આ ડેટા સેટ્સનું વિશ્લેષણ કરવાનું છે અને એક જ વ્યક્તિ માટે કેટલા અવલોકનો સંદર્ભ આપે છે, કયા અવલોકનો વર્તમાન છે અને કયા ઉપયોગ કરવા યોગ્ય છે તે શોધવાનું છે.

મોટી અથવા નાની ડેટા સંપત્તિઓ સાથે કામ કરતી વખતે અવાજ અથવા ભૂલભરેલા ડેટાને દૂર કરવા માટે આ પ્રકારની ડેટા સફાઈ જરૂરી છે, પરંતુ તે પર્યાપ્ત નથી. અમારે અમારા અગાઉના અનુભવ, એનાલિટિક્સ અને કેટેગરીના જ્ઞાનના આધારે મોટી ડેટા અસ્કયામતોની આસપાસ સંદર્ભ પણ બનાવવો જોઈએ. હકીકતમાં, ઘણા વિશ્લેષકો સ્પર્ધાત્મક લાભના સ્ત્રોત તરીકે મોટા ડેટામાં રહેલી અનિશ્ચિતતાને સંચાલિત કરવાની ક્ષમતા તરફ નિર્દેશ કરે છે, કારણ કે તે વધુ સારા નિર્ણયો લેવામાં સક્ષમ બનાવે છે.

આ તે છે જ્યાં પ્રાથમિક સંશોધન માત્ર મોટા ડેટા દ્વારા પોતાને મુક્ત કરતું નથી, પરંતુ મોટા ડેટાની અંદર સામગ્રીની રચના અને વિશ્લેષણમાં પણ ફાળો આપે છે.

આનું મુખ્ય ઉદાહરણ સોશિયલ મીડિયા પર અમારા નવા મૂળભૂત રીતે અલગ બ્રાન્ડ ઇક્વિટી ફ્રેમવર્કનો ઉપયોગ છે (અમે માં વિકસિત વિશે વાત કરી રહ્યા છીએમિલવર્ડ બ્રાઉનબ્રાન્ડ ઇક્વિટી માપવા માટે એક નવો અભિગમ અર્થપૂર્ણ રીતે અલગ ફ્રેમવર્ક- "અર્થપૂર્ણ તફાવતનો દાખલો" -આર & ટી ). આ મોડેલનું ચોક્કસ બજારોમાં વર્તન પર પરીક્ષણ કરવામાં આવ્યું છે, પ્રમાણભૂત ધોરણે અમલમાં મૂકવામાં આવ્યું છે, અને અન્ય માર્કેટિંગ ક્ષેત્રોમાં સરળતાથી લાગુ થાય છે અને માહિતી સિસ્ટમોનિર્ણય સમર્થન માટે. બીજા શબ્દોમાં કહીએ તો, અમારા બ્રાંડ ઇક્વિટી મોડલ, સર્વેક્ષણ સંશોધન દ્વારા (જોકે ફક્ત તેના પર આધારિત નથી) માહિતગાર છે, તેમાં મોટા ડેટાની અસંરચિત, અસંબંધિત અને અનિશ્ચિત પ્રકૃતિને દૂર કરવા માટે જરૂરી તમામ સુવિધાઓ છે.

સોશિયલ મીડિયા દ્વારા આપવામાં આવેલ ગ્રાહક સેન્ટિમેન્ટ ડેટાને ધ્યાનમાં લો. કાચા સ્વરૂપમાં, ઉપભોક્તા સેન્ટિમેન્ટમાં શિખરો અને ચાટ ઘણી વાર બ્રાન્ડ ઇક્વિટી અને વર્તનના ઑફલાઇન માપદંડો સાથે ઓછામાં ઓછા સહસંબંધિત હોય છે: ડેટામાં ખૂબ જ ઘોંઘાટ છે. પરંતુ અમે અમારા ઉપભોક્તા અર્થ, બ્રાન્ડ ડિફરન્સિએશન, ડાયનેમિક્સ અને વિશિષ્ટતાના અમારા મોડલ્સને કાચા ગ્રાહક સેન્ટિમેન્ટ ડેટામાં લાગુ કરીને આ અવાજને ઘટાડી શકીએ છીએ - આ પરિમાણો સાથે સોશિયલ મીડિયા ડેટાને પ્રોસેસ કરવાની અને એકત્ર કરવાની એક રીત.

એકવાર અમારા ફ્રેમવર્ક અનુસાર ડેટા ગોઠવાઈ જાય, પછી ઓળખવામાં આવેલા વલણો સામાન્ય રીતે ઑફલાઇન બ્રાન્ડ ઇક્વિટી અને વર્તણૂકીય પગલાં સાથે સંરેખિત થાય છે. આવશ્યકપણે, સોશિયલ મીડિયા ડેટા પોતાના માટે બોલી શકતો નથી. આ હેતુ માટે તેનો ઉપયોગ કરવા માટે અમારો અનુભવ અને બ્રાન્ડની આસપાસ બનેલા મોડલની જરૂર છે. જ્યારે સોશિયલ મીડિયા આપણને બ્રાન્ડનું વર્ણન કરવા માટે ઉપભોક્તાઓ દ્વારા ઉપયોગમાં લેવામાં આવતી ભાષામાં વ્યક્ત કરવામાં આવેલી અનન્ય માહિતી આપે છે, ત્યારે પ્રાથમિક સંશોધનને વધુ અસરકારક બનાવવા માટે અમારું સંશોધન બનાવતી વખતે આપણે તે ભાષાનો ઉપયોગ કરવો જોઈએ.

મુક્તિ સંશોધનના લાભો

આ અમને પાછું લાવે છે કે કેટલો મોટો ડેટા સંશોધનને મુક્ત કરવા જેટલું સ્થાન લેતું નથી. સંશોધકોને દરેક નવા કેસ માટે નવો અભ્યાસ બનાવવાની જરૂરિયાતમાંથી મુક્ત કરવામાં આવશે. સતત વધતી જતી મોટી ડેટા અસ્કયામતોનો ઉપયોગ વિવિધ સંશોધન વિષયો માટે થઈ શકે છે, જે અનુગામી પ્રાથમિક સંશોધનને વિષયમાં વધુ ઊંડે સુધી પહોંચવા અને હાલના અવકાશને ભરવા માટે પરવાનગી આપે છે. સંશોધકોને વધુ પડતા મોંઘા સર્વેક્ષણો પર આધાર રાખવાથી મુક્ત કરવામાં આવશે. તેના બદલે, તેઓ ટૂંકા સર્વેક્ષણોનો ઉપયોગ કરી શકે છે અને સૌથી મહત્વપૂર્ણ પરિમાણો પર ધ્યાન કેન્દ્રિત કરી શકે છે, જે ડેટાની ગુણવત્તામાં સુધારો કરે છે.

આ મુક્તિ સાથે, સંશોધકો તેમના સ્થાપિત સિદ્ધાંતો અને વિચારોનો ઉપયોગ મોટી ડેટા સંપત્તિઓમાં ચોકસાઇ અને અર્થ ઉમેરવા માટે કરી શકશે, જે સર્વે સંશોધન માટે નવા ક્ષેત્રો તરફ દોરી જશે. આ ચક્ર વ્યૂહાત્મક મુદ્દાઓની શ્રેણી પર વધુ સમજણ તરફ દોરી જવું જોઈએ અને છેવટે, જે હંમેશા અમારું પ્રાથમિક ધ્યેય હોવું જોઈએ - બ્રાન્ડ અને સંદેશાવ્યવહારના નિર્ણયોની ગુણવત્તાને જાણ કરવી અને સુધારવા માટે.

બિગ ડેટા શબ્દ સામાન્ય રીતે સ્ટ્રક્ચર્ડ, સેમી-સ્ટ્રક્ચર્ડ અને અનસ્ટ્રક્ચર્ડ ડેટાની કોઈપણ રકમનો સંદર્ભ આપે છે. જો કે, બીજા અને ત્રીજાને અનુગામી માહિતી વિશ્લેષણ માટે ઓર્ડર કરી શકાય છે અને જોઈએ. બિગ ડેટા કોઈપણ વાસ્તવિક વોલ્યુમ સાથે સમકક્ષ હોતો નથી, પરંતુ મોટા ભાગના કિસ્સાઓમાં જ્યારે મોટા ડેટા વિશે વાત કરવામાં આવે છે ત્યારે અમારો અર્થ ટેરાબાઈટ, પેટાબાઈટ અને માહિતીના એક્સ્ટ્રાબાઈટ પણ થાય છે. કોઈપણ વ્યવસાય સમય જતાં આટલી માત્રામાં ડેટા એકઠા કરી શકે છે, અથવા, એવા કિસ્સામાં કે જ્યાં કંપનીને ઘણી બધી માહિતી પ્રાપ્ત કરવાની જરૂર હોય, વાસ્તવિક સમયમાં.

મોટા ડેટા વિશ્લેષણ

બિગ ડેટા વિશ્લેષણ વિશે વાત કરતી વખતે, અમારો અર્થ મુખ્યત્વે વિવિધ સ્ત્રોતોમાંથી માહિતીનો સંગ્રહ અને સંગ્રહ છે. ઉદાહરણ તરીકે, ખરીદી કરનારા ગ્રાહકો વિશેનો ડેટા, તેમની લાક્ષણિકતાઓ, લૉન્ચ કરેલી જાહેરાત ઝુંબેશ વિશેની માહિતી અને તેની અસરકારકતાનું મૂલ્યાંકન, સંપર્ક કેન્દ્રનો ડેટા. હા, આ બધી માહિતીની તુલના અને વિશ્લેષણ કરી શકાય છે. તે શક્ય અને જરૂરી છે. પરંતુ આ કરવા માટે, તમારે એક સિસ્ટમ સેટ કરવાની જરૂર છે જે તમને માહિતીને વિકૃત કર્યા વિના એકત્રિત અને રૂપાંતરિત કરવા, તેને સંગ્રહિત કરવા અને છેવટે, તેને વિઝ્યુઅલાઈઝ કરવાની મંજૂરી આપે છે. સંમત થાઓ, મોટા ડેટા સાથે, ઘણા હજાર પૃષ્ઠો પર છાપેલ કોષ્ટકો વ્યવસાયિક નિર્ણયો લેવામાં થોડી મદદ કરે છે.

1. મોટા ડેટાનું આગમન

વપરાશકર્તાની ક્રિયાઓ વિશેની માહિતી એકત્રિત કરતી મોટાભાગની સેવાઓમાં નિકાસ કરવાની ક્ષમતા હોય છે. તે સુનિશ્ચિત કરવા માટે કે તેઓ સંરચિત સ્વરૂપમાં કંપનીમાં આવે છે, વિવિધ સિસ્ટમોનો ઉપયોગ કરવામાં આવે છે, ઉદાહરણ તરીકે, Alteryx. આ સોફ્ટવેર તમને માહિતી આપમેળે પ્રાપ્ત કરવા, તેની પ્રક્રિયા કરવાની પરવાનગી આપે છે, પરંતુ સૌથી અગત્યનું, તેને વિકૃત કર્યા વિના ઇચ્છિત સ્વરૂપ અને ફોર્મેટમાં રૂપાંતરિત કરવાની મંજૂરી આપે છે.

2. મોટા ડેટાનો સંગ્રહ અને પ્રક્રિયા

લગભગ હંમેશા, જ્યારે મોટી માત્રામાં માહિતી એકત્રિત કરવામાં આવે છે, ત્યારે તેને સંગ્રહિત કરવાની સમસ્યા ઊભી થાય છે. અમે જે પ્લેટફોર્મનો અભ્યાસ કર્યો છે તેમાંથી અમારી કંપની વર્ટિકાને પસંદ કરે છે. અન્ય ઉત્પાદનોથી વિપરીત, વર્ટીકા તેમાં સંગ્રહિત માહિતીને ઝડપથી "પાછી આપવા" સક્ષમ છે. ગેરફાયદામાં લાંબા રેકોર્ડિંગનો સમાવેશ થાય છે, પરંતુ મોટા ડેટાનું વિશ્લેષણ કરતી વખતે, વળતરની ઝડપ સામે આવે છે. ઉદાહરણ તરીકે, જો આપણે માહિતીના પેટાબાઈટનો ઉપયોગ કરીને સંકલન વિશે વાત કરી રહ્યા છીએ, તો અપલોડ ઝડપ એ સૌથી મહત્વપૂર્ણ લાક્ષણિકતાઓમાંની એક છે.

3. મોટા ડેટા વિઝ્યુલાઇઝેશન

અને અંતે, ડેટાના મોટા જથ્થાનું વિશ્લેષણ કરવાનો ત્રીજો તબક્કો છે. આ કરવા માટે, તમારે એક પ્લેટફોર્મની જરૂર છે જે અનુકૂળ સ્વરૂપમાં બધી પ્રાપ્ત માહિતીને દૃષ્ટિની રીતે પ્રતિબિંબિત કરી શકે. અમારા મતે, ફક્ત એક સૉફ્ટવેર ઉત્પાદન કાર્યનો સામનો કરી શકે છે - ટેબ્લો. અલબત્ત, આજે શ્રેષ્ઠ ઉકેલોમાંથી એક કે જે કોઈપણ માહિતીને દૃષ્ટિની રીતે બતાવી શકે છે, કંપનીના કાર્યને ત્રિ-પરિમાણીય મોડેલમાં ફેરવી શકે છે, તમામ વિભાગોની ક્રિયાઓને એક પરસ્પર નિર્ભર સાંકળમાં એકત્રિત કરી શકે છે (તમે ટેબ્લોની ક્ષમતાઓ વિશે વધુ વાંચી શકો છો).

તેના બદલે, ચાલો નોંધ લઈએ કે લગભગ કોઈપણ કંપની હવે પોતાનો બિગ ડેટા બનાવી શકે છે. મોટા ડેટા વિશ્લેષણ હવે જટિલ અને ખર્ચાળ પ્રક્રિયા નથી. કંપની મેનેજમેન્ટે હવે એકત્રિત કરેલી માહિતી માટે યોગ્ય રીતે પ્રશ્નો તૈયાર કરવા જરૂરી છે, જ્યારે વ્યવહારીક રીતે કોઈ અદ્રશ્ય ગ્રે વિસ્તારો બાકી નથી.

ટેબ્લો ડાઉનલોડ કરો

મફતમાં ડાઉનલોડ કરો સંપૂર્ણ સંસ્કરણ Tableau ડેસ્કટોપ, 14 દિવસ અને Tableau બિઝનેસ એનાલિટિક્સ તાલીમ સામગ્રી ભેટ તરીકે મેળવો



શું તમને લેખ ગમ્યો? તમારા મિત્રો સાથે શેર કરો!