دقیقا "داده بزرگ" چیست؟

و چرا این یک معامله بزرگ است؟

داده های بزرگ علم جدید درک و پیش بینی رفتار انسان با مطالعه حجم زیادی داده های بدون ساختار است. داده های بزرگ نیز به عنوان "تجزیه و تحلیل پیش بینی" شناخته شده است.

تجزیه و تحلیل پست های توییتر، خوراک فیس بوک، جستجوهای eBay، پیگیری های GPS و دستگاه های خودپرداز، نمونه ای از داده های بزرگ هستند. مطالعه فیلم های امنیتی، اطلاعات ترافیکی، الگوهای آب و هوایی، ورود به سیستم، سیاهههای مربوط به برج های تلفن همراه و ردیاب های ضربان قلب، فرم های دیگر هستند. داده های بزرگ یک علم جدید کثیف است که هر بار تغییر می کند و فقط چند کارشناس همه را درک می کنند.

برخی از نمونه های داده بزرگ در زندگی منظم چه هستند؟

تصویری http://project.wnyc.org/transit-time

در حالیکه پروژه های بزرگ داده ها بسیار مبهم هستند، نمونه های موفقیت آمیزی از اطلاعات بزرگ بر زندگی روزمره افراد، شرکت ها و دولت ها وجود دارد:

پیش بینی شیوع ویروس ها: با مطالعه داده های اجتماعی-سیاسی، داده های هواشناسی و اقلیمی و اطلاعات بیمارستان / بالینی، این دانشمندان اکنون با پیشگویی 4 هفته پیش از شیوع تب دنگی پیش بینی می کنند.

سازمان دیده بان حقوق بشر: این پرونده های اطلاعات بزرگ پرونده های قربانیان، مظنونین، و جنایتکاران را در واشنگتن دی سی مورد قتل قرار می دهد. هر دو به عنوان یک راه برای احترام به مرحوم و به عنوان یک منبع آگاهی برای مردم، این پروژه داده بزرگ جذاب است.

برنامه ریزی سفر مسافری، نیویورک: برنامه نویس رادیو WNYC استیو ملندز، برنامه مترو آنلاین با برنامه سفر سفر را با هم ترکیب کرد. خلقت او اجازه می دهد تا نیویورک ها بر روی مکان خود بر روی نقشه کلیک کنند و پیش بینی زمان سفر برای قطار و مترو به نظر می رسد.

Xerox کاهش ضرر و زیان نیروی کار خود را کاهش داد: کار مرکز تماس تلفنی عجیب و غریب است. Xerox با کمک تحلیلگران حرفه ای داده های جدیدی را مورد مطالعه قرار داده و اکنون می توانند پیش بینی کنند که کدام مرکز تماس را استخدام می کند، احتمالا با شرکت طولانی ترین است.

حمایت از مبارزه با تروریسم: با مطالعه رسانه های اجتماعی، پرونده های مالی، رزرو پرواز و اطلاعات امنیتی، اجرای قانون می تواند پیش از انجام اقدامات ستمکارانه خود مظنونین تروریستی را پیش بینی کند.

تنظیم بازاریابی برند بر اساس بررسی رسانه های اجتماعی : مردم به طور صریح و سریع به اشتراک خود افکار خود را در یک باشگاه، رستوران، و یا تناسب اندام. ممکن است این میلیون ها پست رسانه های اجتماعی را مطالعه و بازخوردی را برای شرکت در مورد آنچه که مردم در مورد خدماتشان فکر می کنند، ارائه دهند.

چه کسی از داده های بزرگ استفاده می کند؟ آنها با این کار چه می کنند؟

بسیاری از شرکت های یکپارچه از داده های بزرگ استفاده می کنند تا پیشنهادات و قیمت های خود را برای به حداکثر رساندن رضایت مشتریان تنظیم کنند.

چرا داده های بزرگ چنین بزرگی را انجام می دهند؟

4 چیز مهم است:

1. اطلاعات گسترده است. این در یک هارد دیسک مناسب نیست، و کمتر یک قلم USB . حجم داده ها بیش از آنچه ذهن انسان می تواند درک کند (فکر می کنم یک میلیارد میلیارد مگابایت است، و سپس آن را با میلیاردها بیشتر افزایش می یابد).

2. داده ها کثیف و بدون ساختار هستند. 50 تا 80 درصد کارهای داده بزرگ، تبدیل و تمیز کردن اطلاعات است تا جستجو و مرتب شود. فقط چند هزار کارشناس در سیاره ما به طور کامل می دانیم چگونه این پاک سازی داده ها را انجام دهیم. این کارشناسان همچنین نیاز به ابزارهای بسیار تخصصی مانند HPE و Hadoop برای انجام کارهای خود دارند. شاید در ده سال گذشته، متخصصان داده های بزرگ به یک دهم تبدیل می شوند، اما در حال حاضر، آنها یک نمونه بسیار نادر از تحلیل گر هستند و کار آنها هنوز بسیار مبهم و خسته کننده است.

3. داده ها تبدیل به یک کالا ** می شود که می تواند فروخته و خریداری شود. بازار اطلاعات وجود دارد که شرکت ها و افراد می توانند ترابایت رسانه های اجتماعی و سایر اطلاعات را خریداری کنند. اکثر داده ها مبتنی بر ابر هستند، زیرا برای قرار دادن روی هر دیسک سخت، خیلی بزرگ است. اطلاعات خرید معمولا شامل هزینه اشتراک است که در آن شما به یک مزرعه سرور ابر وصل می شوید.

** رهبران ابزار و ایده های بزرگ داده ها آمازون، گوگل، فیس بوک و یاهو هستند. از آنجاییکه این شرکت ها به تعداد زیادی میلیون ها نفر از خدمات آنلاین خود خدمت می کنند، منطقی است که آنها نقطه جمع آوری و بینندگان پس از تجزیه و تحلیل داده های بزرگ خواهد بود.

4. امکان داده های بزرگ بی پایان هستند. شاید پزشکان یک روز پیش از وقوع حملات قلبی و سکته مغزی برای افراد پیش بینی کنند. ممکن است تصادفات هواپیما و خودرو با تجزیه و تحلیل پیش بینی شده از اطلاعات مکانی و الگوهای ترافیک و آب و هوا کاهش یابد. دوستیابی آنلاین ممکن است با داشتن پیش بینی های داده های بزرگ از شخصیت های سازگار برای شما بهبود یابد. موسیقیدانان ممکن است درک کنند که ترکیب موسیقی چه طعم دهنده ای برای مخاطبان مورد علاقه است. متخصصان تغذیه می توانند پیش بینی کنند که کدامیک از غذاهایی که در فروشگاه خریداری می شود، شرایط پزشکی را تشدید می کند یا به او کمک می کند. سطح تنها خراشیده شده است، و کشفیات در داده های بزرگ هر هفته اتفاق می افتد.

اطلاعات بزرگ کثیف است

مونتی راکسن / گتی

داده های بزرگ تجزیه و تحلیل پیش بینی شده است: تبدیل داده های بدون ساختار گسترده به چیزی قابل جستجو و قابل مرتب شدن است. این یک فضای کثیف و هرج و مرج است که نیاز به نوع خاصی از دانش و صبر دارد.

به عنوان مثال یک سرویس تحویل UPS یکپارچه را ببینید. برنامه نویسان در UPS اطلاعات از GPS ها و گوشی های هوشمند راننده خود را مطالعه می کنند تا بهترین راه ها برای انطباق با ترافیک را تحلیل کنند. این اطلاعات جیپیاس و گوشی های هوشمند، به صورت خودکار برای تجزیه و تحلیل آماده نیست. این اطلاعات از طریق GPS و نقشه های مختلف نقشه، از طریق دستگاه های سخت افزاری مختلف گوشی های هوشمند، از بین می رود. تحلیلگران UPS ماه ها را صرف تبدیل همه این داده ها به فرمت شده اند که می توانند به آسانی جستجو و مرتب شوند. با این حال، تلاش این است که ارزش آن را داشته باشد. امروزه UPS بیش از 8 میلیون گالن سوخت را ذخیره کرده است، زیرا آنها با استفاده از این تجزیه و تحلیل داده های بزرگ شروع به کار کردند.

از آنجاییکه داده های بزرگ کثیف هستند و نیاز به تلاش زیادی برای پاکسازی و آماده شدن برای استفاده دارند، دانشمندان داده ها به نام "نگهبانان داده ها" نامیده می شوند برای همه کارهای خسته کننده که انجام می دهند. the

با این وجود، علم داده های بزرگ و تجزیه و تحلیل پیش بینی شده هر هفته بهبود می یابد. انتظار می رود داده های بزرگ برای سال های سال 2025 به راحتی قابل دسترسی باشد.

آیا داده های بزرگ یک تهدید غیرقانونی برای حفظ حریم خصوصی نیست؟

Feingersh / گتی

بله، اگر قوانین و حریم خصوصی افراد با دقت مدیریت نشوند، داده های بزرگ به حریم شخصی وارد می شوند. همانطور که می دانید، گوگل و یوتیوب و فیس بوک قبلا عادات آنلاین روزانه خود را پیگیری می کنند . گوشی هوشمند و محاسبات شما هر روز ردپای دیجیتال را ترک می کند و شرکت های پیشرفته در حال مطالعه این ردپاها هستند.

قوانین اطراف داده های بزرگ در حال تکامل هستند. حریم خصوصی وضعیتی است که شما اکنون باید مسئولیت شخصی خود را بر عهده بگیرید، زیرا دیگر نمیتوانید آن را به عنوان پیش فرض مورد انتظار قرار دهید.

آنچه شما می توانید برای محافظت از حریم خصوصی خود انجام دهید:

بزرگترین مرحله تنها شما می توانید عادت های روزانه خود را با استفاده از اتصال شبکه VPN پنهان کنید . یک سرویس VPN سیگنال شما را تقلید می کند تا هویت و موقعیت مکانی شما از دست ردگیرها به حداقل رسیده باشد. این به شما 100٪ ناشناس نیست، اما یک VPN به میزان قابل توجهی کاهش می دهد که جهان چگونه می تواند عادت های آنلاین را مشاهده کند.

کجا می توانم اطلاعات بیشتری در مورد داده های بزرگ کسب کنم؟

مونتی راسكسن / گتی

داده های بزرگ چیز مهیج برای افرادی است که اندیشه های تحلیلی و عشق به تکنولوژی دارند. اگر این شما هستید، قطعا این صفحه از پروژه های جالب داده های بزرگ را ببینید.