Знания в современных компаниях. Чем данные отличаются от информации

Часто данные и информация отождествляются, однако между двумя терминами есть существенное различие:

Информация - знания, касающиеся понятий и объектов (факты, события, вещи, процессы, идеи) в человеческом мозге;

Данные - представление переработанной информации, пригодной для передачи, толкования, или обработки (компьютерные файлы, бумажные документы, записи в информационной системе).

Отличие информации от данных состоит в том, что:

1) данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач.

Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

2)данные - это носители информации, а не сама информация.

3)Данные превращаются в информацию только тогда, когда ими заинтересуется человек. Человек извлекает информацию из данных, оценивает, анализирует ее и по результатам анализа принимает то или иное решение.

Данные превращаются в информацию несколькими путями:

Контекстуализация: мы знаем, для чего эти данные нужны;

Подсчет: мы обрабатываем данные математически;

Коррекция: мы исправляем ошибки и ликвидируем пропуски;

Сжатие: мы сжимаем, концентрируем, агрегируем данные.

Таким образом, если существует возможность использовать данные для уменьшения неопределенности знаний о каком-либо предмете, то данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные.

4)Информацию можно измерять. Мера измерения содержательности информации связана с изменением степени неосведомленности получателя и основана на методах теории информации.

2. Предметная область - это часть реального мира, данные о которой мы хотим отразить в базе данных. Предметная область бесконечна и содержит как существенно важные понятия и данные, так и малозначащие или вообще не значащие данные. Таким образом, важность данных зависит от выбора предметной области.

Модель предметной области . Модель предметной области - это наши знания о предметной области. Знания могут быть как в виде неформальных знаний в мозгу эксперта, так и выражены формально при помощи каких-либо средств. Опыт показывает, что текстовый способ представления модели предметной области крайне неэффективен. Гораздо более информативными и полезными при разработке баз данных являются описания предметной области, выполненные при помощи специализированных графических нотаций. Имеется большое количество методик описания предметной области. Из наиболее известных можно назвать методику структурного анализа SADT и основанную на нем IDEF0, диаграммы потоков данных Гейна-Сарсона, методику объектно-ориентированного анализа UML, и др. Модель предметной области описывает скорее процессы, происходящие в предметной области и данные, используемые этими процессами. От того, насколько правильно смоделирована предметная область, зависит успех дальнейшей разработки приложений.

3. Ба́за да́нных - представленная в объективной форме совокупность самостоятельных материалов (статей, расчётов, нормативных актов, судебных решений и иных подобных материалов), систематизированных таким образом, чтобы эти материалы могли быть найдены и обработаны с помощью электронной вычислительной машины (ЭВМ).

Многие специалисты указывают на распространённую ошибку, состоящую в некорректном использовании термина «база данных» вместо термина «система управления базами данных», и указывают на необходимость различения этих понятий.

Информация - сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Источник (поставщик) и потребитель (получатель) информации .

Термин информация происходит от латинского informatio, что означает разъяснение, осведомление, изложение. В широком смысле информация определяется как сведения (сообщения) о той или иной стороне материального мира и процессах. Сообщение - это форма представления информации в виде речи, текста, изображения, цифровых данных, графиков, таблиц и т.п.

Информация - это общенаучное понятие, включающее в себя обмен сведениями между людьми, обмен сигналами между живой и неживой природой, людьми и устройствами.

Следует помнить, что: информация существует вне ее создателя ; информация становится сообщением, как только выражена на определенном языке.

Наряду c понятием «информация» часто употребляется понятие данные . Данные могут рассматриваться как признаки или записанные наблюдения, которые по каким-то причинам не используются, а только хранятся. В том

случае, если появляется возможность использовать эти данные для уменьшения неопределенности о чем-либо, данные превращаются в информацию. Поэтому можно утверждать, что информацией являются используемые данные .

Информация - структурированные данные.

Информация (в биологии) = Биология изучает живую природу и понятие «информация» связывается с целесообразным поведением живых организмов. В живых организмах информация передается и храниться с помощью объектов различной физической природы (состояние ДНК), которые рассматриваются как знаки биологических алфавитов. Генетическая информация передается по наследству и хранится во всех клетках живых организмов.

Информация (в философии) = это взаимодействие, отражение, познание.

Информация (в кибернетике) = это характеристики управляющего сигнала, передаваемого по линии связи.

Можно выделить следующие подходы к определению информации:

- традиционный (обыденный) используется в информатике: Информация – это сведения, знания, сообщения о положении дел, которые человек воспринимает из окружающего мира с помощью органов чувств (зрения, слуха, вкуса, обоняния, осязания).

- вероятностный - используется в теории об информации: Информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределённости и неполноты знаний.

Информация хранится, передается и обрабатывается в символьной (знаковой) форме . Одна и та же информация может быть представлена в различной форме:

1) Знаковой письменной, состоящей из различных знаков среди которых выделяют символьную в виде текста, чисел, спец. символов; графическую; табличную и т.д.

2) В виде жестов или сигналов.

3) В устной словесной форме (разговор).

Представление информации осуществляется с помощью языков, как знаковых систем, которые строятся на основе определенного алфавита и имеют правила для выполнения операций над знаками.

Язык – определенная знаковая система представления информации.

Естественные языки – разговорные языки в устной и письменной форме. В некоторых случаях разговорную речь могут заменить язык мимики и жестов, язык специальных знаков (например, дорожных);

Формальные языки специальные языки для различных областей человеческой деятельности, которые характеризуются жестко зафиксированным алфавитом, более строгими правилами грамматики и синтаксиса. Это язык музыки (ноты), язык математики (цифры, математические знаки), системы счисления, языки программирования и т.д.

В основе любого языка лежит алфавит – набор символов/знаков.

Полное число символов алфавита принято называть мощностью алфавита .

Носители информации – среда или физическое тело для передачи, хранения и воспроизведения информации. Это электрические, световые, тепловые, звуковые, радио сигналы, магнитные и лазерные диски, печатные издания, фотографии и т.д.


Модуль 1 (1,5 кредит): Введение в экономическую информатику

Тема 1.1: Теоретические основы экономической информатики

Тема 1.2: Технические средства обработки информации

Тема 1.3: Системное программное обеспечение

Тема 1.4: Сервисное программное обеспечение и основы алгоритмизации

Экономическая информатика и информация

1.1. Теоретические основы экономической информатики

1.1.2. Данные, информация и знания

Основные понятия данных, информации, знаний.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач.

Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.


Рис. 1.

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.

В самом начале этой главы необходимо подчеркнуть разли чия между понятиями данные и информация. Между ними есть разница и довольно существенная. Согласно теории информации под данными следует понимать все те сведения, которые собираются и, что особенно важно, подвергаются специальной обработ ке с целью вьщеления из них (в том числе и с помощью расчетов) только тех сведений, которые окажутся необходимыми и полезны ми для решения данной конкретной задачи. Эти обработанные данные будут представлять собой информацию. А необработан ные сведения принято называть данными. Таким образом - подобная аналогия здесь вполне уместна - данные можно уподобить какой-либо руде, а информацию - добытым из нее полезным веществам. Данные всегда ассоциируют с избытком сведений, информацию же - с необходимой достаточностью. Информация, другими словами,- это то, что способствует приращению знаний, она всегда несет на себе печать новизны, представляет собой новые сведения. Но если сосредоточиться на маркетинговых исследова ниях, информация - это не любые новые сведения. В конечном итоге - это такие новые сведения, которые восприняты и оцене ны соответствующими службами (специалистами) для совершения конкретных профессиональных действий.

Передача данных и появление информации

Многочисленные трансформации данных на пути их превращения в информацию можно проследить по схеме, предложенной профессором Е.Г. Ясиным (рис. 5.1).

Согласно этой схеме какая-то часть данных на пути движения к получателю первоначально теряется в физических каналах их передачи в форме так называемого физического шума (например, при проведении анкетирования в маркетинговых исследованиях некоторые анкеты оказались неправильно заполненными и их изымают из предстоящей обработки). Дошедшие до получателя данные (принятые) могут быть не все поняты им и восприняты в силу, допустим, недостаточного уровня знаний. Непонятые и невоспринятые данные проходят мимо сознания получателя в форме семантического шума. И наконец, из воспринятых получателем данных некоторая часть может быть просто им проигнорирована из-за того, что окажется излишней или просто непригодной для решаемых задач. В форме прагматического шума эта часть сообщений также проходит мимо сознания получателя. Оставшаяся часть данных и представляет собой собственно информацию, которая может быть использована в решении практических задач. Ясно, что на этапе оценки, по схеме Ясина, происходит и обработка данных, производятся необходимые вычислительные процедуры, сравнения и т.п.

На практике понятия данные и информация часто отождествляют между собой, т.е. подменяют одно другим, что не способствует улучшению взаимопонимания между, допустим, исследователями рынка и заказчиками такого исследования при заключении между ними контрактов на проведение маркетинговых исследований. Но иногда такие отождествления вполне допустимы. В данной книге понятие информация будет применяться значительно чаще, чем понятие данные, хотя иногда автор воспользуется и понятием данные. Объяснение здесь простое: все дело в сложившихся традициях. В маркетинге, когда говорят об обосновании решений, чаще применяют термин информация, даже если речь идет о выборе для этого обоснования необходимых сведений (т.е. собственно информации) из их больших массивов (т.е. из массивов данных). А термин данные применяют в основном при первоначальном сборе любых сведений. Большого противоречия теории информации здесь нет, а поэтому сложившаяся традиция не нарушается.