ماذا تعني البيانات غير المهيكلة؟
البيانات غير المهيكلة Unstructured Data هي معلومات رقمية لا يمكن تخزينها بكفاءة في قاعدة بيانات علائقية (RDMS) لأنها لا تستخدم نماذج أو مخططات بيانات محددة مسبقًا.
وغالبًا ما يتم تخزين البيانات غير المهيكلة، والتي يمكن أن تكون خامًا، في بحيرة بيانات. تشمل مصادر البيانات غير المهيكلة أجهزة الاستشعار والمشغلات والبريد الإلكتروني والرسائل النصية ومستندات وورد وعروض باور بوينت التقديمية والسجلات الصحيةالإلكترونية والصور الرقمية والملفات الصوتية ومقاطع الفيديو.
في الأعمال التجارية التي تركز على العملاء، يمكن تحليل البيانات الموجودة في شكل غير منظم لتعزيز تسويق العلاقات وإدارة علاقات العملاء (CRM).
شرح Techopedia للبيانات غير المهيكلة
تشير البيانات غير المهيكلة إلى البيانات التي تتبع شكلاً أقل ترتيبًا من عناصر مثل صفحات جداول البيانات أو جداول قواعد البيانات أو غيرها من مجموعات البيانات الخطية أو المرتبة. في الواقع، يُعتبر مصطلح “مجموعة البيانات” مفيدًا لأنه يرتبط بالبيانات التي تكون في مصفوفات مرتبة ومرتبة ويمكن الوصول إليها دون أي محتوى إضافي، وتكون مرتبطة أو موسومة ببنية محددة.
وتتضمن الأمثلة الأخرى للبيانات النصية غير المهيكلة مستندات Word وعروض PowerPoint التقديمية والرسائل الفورية وبرامج التعاون والوثائق والكتب ومنشورات وسائل التواصل الاجتماعي والسجلات الطبية. يتم إنشاء البيانات غير المهيكلة غير النصية بشكل عام في الوسائط، مثل ملفات الصوت MP3 والصور JPEG وملفات الفيديو الفلاش وغيرها.
لا تتضمن البيانات غير المهيكلة عادةً نموذج بيانات محدد مسبقًا، وقد لا تتطابق بشكل جيد مع الجداول العلائقية. عادةً ما تكون البيانات غير المهيكلة ثقيلة النصوص. ومع ذلك، قد تتضمن أرقامًا وتواريخ، بالإضافة إلى حقائق. وهذا يؤدي إلى غموض يصعب تحديده باستخدام البرامج التقليدية.
قد يؤدي تخزين كميات ضخمة من البيانات غير المهيكلة التي يتم إنشاؤها داخل المؤسسة، إذا تمت إدارتها بشكل سيئ، إلى ارتفاع النفقات. يجب مسح البيانات الموجودة في مستندات ورقية أو في شكل إلكتروني حتى يتمكن تطبيق البحث من تحليل الأفكار، اعتمادًا على الكلمات المستخدمة في سياقات معينة. ويُعرف ذلك باسم البحث المؤسسي أو البحث الدلالي.