Система управления данными. Процесс управление данными Характеристика наборов данных

Cookie – это небольшой текстовый файл на вашем устройстве, который запускает функции и возможности веб-сайта.

Cookie-файл представляет собой небольшой текстовый файл, который веб-сайт запрашивает у вашего веб-браузера и сохраняет на вашем устройстве, чтобы запомнить какой язык вы предпочитаете и другую подобную информацию о вас, а также запускает функции и возможности веб-сайта.

В Comindware мы стараемся быть ясны и откровенны касательно того, какие данные о вас мы собираем и как их используем. И эта Политика предоставляет подробную информацию о том, какие cookie-файлы мы собираем и как мы используем данные о вас. Эта политика использования cookie-файлы применяется к веб-сайту Comindware.

Всегда включённые

Обеспечивают ваш персонализированный опыт и должную работу веб-сайта.

Всегда включённые cookie-файлы помогают нам обеспечивать персонализированный опыт использования веб-сайта для вас и не могут быть отключены в нашей системе. Вы можете настроить веб-браузер для блокировки или предупреждения об этих файлах cookie, но в последующем некоторые части веб-сайта могут не работать.

Скорость работы сайта

Используются для постоянной оптимизации и улучшения веб-сайта.

Cookie-файлы производительности помогают нам постоянно оптимизировать и улучшать веб-сайт. Эти файлы cookie позволяют нам считать переходы на веб-сайт, отслеживать источники трафика, определять какие страницы пользуются наибольшей популярностью и приносят пользу посетителям, узнавать как пользователи перемещаются по веб-сайту. Все данные собираются в эти cookie-файлы в обобщённой форме и потому анонимны.

Управление данными – это процесс, который подразумевает сбор, хранение, обработку и интерпретацию накопленных данных. Сегодня для многих компаний управление данными – это отличная возможность понять данные, которые уже собраны, «узнать» конкурентов, выстроить предикативную аналитику (прогнозирование), ответить на многие вопросы бизнеса.

Управление данными

Что включает управление данными? Перечислим основные процессы:

  • Управление базами данных
  • ETL-процессы (извлечение, преобразование и загрузка данных)
  • Сбор данных
  • Защита и шифрование данных
  • Моделирование данных
  • Собственно анализ данных

Исходя из вышеперечисленного становится ясно, что для успешного управления данными необходимо:

  • Решить технические вопросы (выбрать базу данных, определить, где будут храниться данные – в облаке, на сервере и т.д.)
  • Найти грамотные человеческие ресурсы 🙂

Основные проблемы при управлении данными

Среди самых распространенных ошибок и трудностей, которые возникают при сборе, хранении и интерпретации данных, называют:

  • Неполные данные
  • «Задваивание» данных (причем нередко противоречащих друг другу)
  • Устаревшие данные

Во многих вопросах на этапе сбора загрузки данных может помочь такой продукт, как , который помогает соединять данные из разных источников, обогащать и готовить их к использованию в системах Business Intelligence.

Анализ данных

У вас уже есть подходящий объем нужных и важных данных? Теперь, помимо хранения, их нужно анализировать. Анализ данных поможет ответить на многие вопросы бизнеса, принять взвешенные решения, «увидеть» своего покупателя, оптимизировать складские и логистические процессы. В общем, анализ данных важен и нужен в любой сфере, любой компании, на любом уровне.

Решение для анализа данных состоит из трех основных блоков:

  • Хранилище данных;
  • ETL-процедуры (извлечение, преобразование и загрузка данных);
  • Система отчетности и визуальной аналитики.

Все это кажется достаточно сложным, но на самом деле не все так страшно.

Современные аналитические решения

Что делать компаниям, у которых нет штата аналитиков? И нет программиста-разработчика? Но есть желание делать аналитику!

Конечно, решение есть. Сейчас на рынке представлено достаточно автоматизированных систем для аналитики и – что важно! – визуализации ваших данных.

В чем плюсы таких систем (типа ):

  • Возможность быстро внедрить (скачивайте программу и устанавливаете хотя бы к себе на ноутбук)
  • Нет необходимости в сложных IT- или математических знаниях
  • Невысокая стоимость (от 2 000 руб. в месяц за лицензию на март 2018 года)

Таким образом, внедрить такой аналитический продукт может любая компания: неважно, сколько сотрудников в ней работает. Tableau подходит и индивидуальным предпринимателям, и крупным компаниям. В апреле 2018 года ООН выбрала Tableau в качестве аналитической платформы для всех своих офисов по всему миру!

Компании, которые работают с такими автоматизированными системами аналитики, отмечают, что табличные отчеты, которые раньше строились за 6 часов, в Tableau собираются буквально за 10-15 минут.

Не верите? Попробуйте сами – скачайте бесплатную пробную версию Tableau и получите обучающие материалы по работе с программой:

Скачать Tableau

Скачайте БЕСПЛАТНО полную версию Tableau Desktop, 14 дней и получите в ПОДАРОК обучающие материалы по бизнес-аналитике Tableau

Данные являются одним из важнейших видов активов, которыми необходимо управлять для того, чтобы эффективно развивать, предоставлять и поддерживать услуги ИТ.

Управление Данными/ Управление Информацией (Data/Information Management) – это все относящееся к тому, как организация планирует, собирает, создает, организует, использует, контролирует, распространяет и избавляется от своих данных (информации), это относится к структурированным и неструктурированным данным. Управление данными гарантирует, что ценность данных/информации выявлена и используется, как для поддержки внутренней деятельности, так и для повышения стоимости бизнес-процессов, обслуживающих клиентов.

В этой области широко используются термины: «Управление данными», «Управление информацией» и «Управление информационными ресурсами». В рамках настоящей публикации, используется термин «Управление данными» в качестве условного обозначения всех трех вышеприведенных.

Роль Управления данными состоит не просто в управлении сырыми данными; она в управлении всеми контекстуальными метаданными - дополнительными «данными о данных», - что идут с ними, а при добавлении к необработанным данным дают «информацию» или «данные в контексте» («data in context»).

Данные, как основа для информации организации, имеют все необходимые атрибуты, чтобы рассматриваться в качестве актива или ресурса (asset or resource). Например, данные важны для «достижения бизнес-целей и успешной повседневной работы организации». Кроме того, они могут быть «получены и сохранены в организации, но только с финансовыми затратами». Наконец, возможно, наряду с другими ресурсами / активами, будут использованы для «дальнейшего достижения целей организации».

Ключевые факторы успешного Управления данными следующие:

Все пользователи имеют доступ через различные каналы к информации, необходимой для выполнения своей работы;
Ценные данные полностью эксплуатируются, путем совместного использования (data sharing) данных в пределах организации и с другими организациями;
Качество данных организации сохраняется на приемлемом уровне и информация, используемая в бизнесе, является точной, надежной и последовательной;
Юридические требования к защите неприкосновенности частной информации, безопасности, конфиденциальности и целостности данных соблюдаются;
Организация обеспечивает высокий уровень эффективности и результативности в деятельности по обработке данных и информации;
Модель данных предприятия определяет наиболее важные сущности и их связи - это поможет избежать избыточности и ухудшения архитектуры, которая и без того меняется с годами.

Управление активами данных (Managing data assets). Если нет эффективного Управления данными, то:

Люди поддерживают и собирают данные, которые не нужны;
Организация может иметь историческую информацию, которая не используется;
Организация может хранить много данных, которые доступны потенциальным пользователям;
Информация может предоставляться большему числу людей, чем необходимо, или не тем, кому она необходима;
Организация может использовать неэффективные и устаревшие методы сбора, анализа, хранения и извлечения данных;
Организация может не справиться со сбором необходимых данных, уменьшить качество и потерять целостность данных, например, между связанными источниками данных.

Кроме того, трудно ответить на вопрос: «действительно ли информация получена из данных хорошего качества?», потому что нет показателей для сравнения. Например, низкое качество данных зачастую возникает из-за плохих проверок в процедурах ввода и/или обновления. После ввода неточных или неполных данных в ИТ-системах, любые отчеты, полученные с использованием этих данных будут отражать эти неточности и пробелы.

Также может быть отсутствие согласованности информации, генерируемой различными оперативными и прочими многочисленными внутренними системами, созданными и используемыми, потому что центральным данным не доверяют.

Одним из путей повышения качества данных, является использование процесса Управления данными (Data Management process), который устанавливает политику и стандарты, предоставляет экспертизу и облегчает обработку аспектов, связанных с данными для новых услуг.

Это должно обеспечить полный Data/Information Asset Management:

Увеличить ценность услуг, предоставляемых клиентам;
Снизить риски в бизнесе;
Сократить расходы на бизнес-процессы;
Стимулировать инновации во внутренние бизнес-процессы.

Область охвата Управления данными (Scope of Data Management)

Существуют четыре области менеджмента, включенных в область действия Управления данными/информацией(Data/Information Management):

Управление информационными ресурсами (Management of data resources): governance информацией в организации должны обеспечить, чтобы все эти ресурсы были известны и были назначены ответственные лица для управления ими, в том числе владельцы данных (ownership) и метаданных.

Этот процесс обычно упоминается как администрирование данных (data administration) и включает ответственность за:

Определение потребности в информации;
- Построение реестра данных (data inventory) и модели данных предприятия;
- Выявление дублирования и недостатков данных;
- Поддержку каталога/индекса информационного контента (data/information content);
- Измерение затрат и ценности данных организации.

Управление технологиями данных/информации (Management of data/information technology): управление подразделением ИТ, поддерживающим информационные системы организации, что включает в себя такие процессы, как проектирование баз данных и управления базами данных. Этими аспектами обычно занимаются специалисты подразделения ИТ.

Управление информационными процессами (Management of information processes): бизнес-процессы приводят услуги ИТ к использованию тех или иных данных. Процессы создания, сбора, доступа, модификации, хранения, удаления и архивирования данных - то есть процессы жизненного цикла данные, - должны быть надлежащим образом контролируемыми, часто совместно с процессом управления приложениями.

Управление стандартами и политикой данных (Management of data standards and policies): организация должна определить стандарты и политику в области Управления данными (Data Management), как элемент стратегии развития ИТ. Эта политика будет регулировать процедуры и ответственности по Управлению данными в организации, техническую политику, архитектуру и стандарты, которые будут применяться к ИТ-инфраструктуре, поддерживающей информационные системы организации.

Область действия процесса Управления данными (согласно best practices) включает в себя управление неструктурированными данными, которые не содержатся в обычных системах баз данных - например, использующие такие форматы, как текст, изображение и звук. Процесс Управления данными также отвечает за обеспечение качества на всех этапах жизненного цикла данных, от сбора требований до окончания эксплуатации. Основное внимание в этой публикации будет сосредоточено на роле Управления данными в фазах сбора требований, проектирования и разработки активов и на жизненном цикле сервиса (Service Lifecycle).

Команда, поддерживающая процесс Управления данными, может также предоставлять службу поддержки бизнес-информации. В этом случае они в состоянии отвечать на вопросы о значении, формате и возможности использования данных внутри организации, потому что они управляют метаданными. Они также в состоянии понять и объяснить, какие внешние данные могут быть необходимы для выполнения необходимых бизнес-процессов и предпринять необходимые действия для доступности внешнего источника данных.

Чрезвычайно важно понимать, при создании или реорганизации процессов и поддержки ИТ-услуг, что хорошая практика – продумывать повторное использования данных и метаданных в различных областях деятельности организации. Способность сделать это может быть поддержана корпоративной моделью данных – иногда называемой общей информационной моделью. Поддержка повторного использования – зачастую одна из главных задач для Управления данными.

09.11.2010 Сергей Лизин

За последнее десятилетие информационные системы незаметно претерпели качественные эволюционные изменения, и сегодня каждая отдельно взятая такая система представляет собой полноценную бизнес-среду, обеспечивающую взаимодействие множества людей. Несмотря на это многие технологии их построения остаются прежними, что не всегда так безобидно, как кажется. Можно предложить ряд методов безболезненной модернизации информационных систем и изменения структур данных.

Возрастающие объемы информации требуют изменения бизнес-процессов предприятий. На смену традиционному бумажно-ориентированному взаимодействию, когда информационные системы лишь обрабатывают сведения из бумажных документов-первоисточников, приходят электронно-ориентированные системы, в которых первоисточником выступает сама информационная система, а точнее - совершаемые в ней операции пользователей. Появление технологий электронной цифровой подписи позволило придать юридическую значимость электронным документам, однако круг задач обеспечения надежного и безопасного функционирования систем подобного рода значительно шире.

Проблемы многопользовательских систем

Большинство современных корпоративных информационных систем - это многопользовательские системы на основе реляционных серверов баз данных. Пользователями таких систем могут быть работники одной или нескольких организаций, а также их клиенты (физические и юридические лица). Возможности пользователей по выполнению отдельных операций в системе (ограниченные функционально или декларативно) в каждый момент времени зависят от содержащихся в ней на тот момент данных. Возникающую здесь проблему управления конкурентным доступом к данным обычно решают с помощью технологии OLTP.

Но не все проблемы конкурентного доступа можно обойти программно за счет транзакций и дополнительных проверок. Основная проблема - человеческий фактор. Каждый пользователь работает не напрямую с данными в СУБД, а с некоторой их локальной копией, загруженной в клиентское приложение. Кроме того, программно невозможно выделить последовательность чтений и записей пользователем данных, составляющих атомарную операцию. Следовательно, нельзя и «откатить» такую транзакцию при изменении данных чтения - система просто не в состоянии определить, какое количество последних действий пользователя образуют единое целое и какие из прочитанных им данных пользователь учел при принятии решения.

В результате оказывается, что транзакции эффективны лишь в отношении серверных задач обработки данных, которые выполняются на сервере приложений или сервере баз данных в фоновом режиме по заранее заданному алгоритму и без активного участия пользователя. Конечно, можно попытаться спроектировать архитектуру системы таким образом, чтобы каждое действие пользователя представляло собой отдельную транзакцию, в рамках которой осуществлялись бы все возможные проверки согласованности данных (то есть факт запуска пользователем транзакции и переданные параметры не должны основываться на данных, прочитанных пользователем в системе, которые не проверяются в рамках транзакции). Однако не всегда и не все проверки, осуществляемые человеком, можно легко описать на языке запросов. Кроме того, это многократно увеличивает сложность, а следовательно, и стоимость разработки.

С другой стороны, обеспечение высокого уровня надежности в части согласованности данных критично лишь для нескольких наиболее значимых категорий данных, для которых как раз может быть организовано управление в режиме OLTP. Для остальных категорий данных обеспечение информационной безопасности вполне может сводиться к организации отслеживания всех изменений, производимых пользователями, причем не только последних, но и всех предшествующих.

Данные с историей

Сегодня при построении баз данных практически повсеместно используется принцип хранения только текущих данных. Этот подход, бывший весьма актуальным в условиях дефицита дискового пространства и вычислительных мощностей, сегодня в чем-то можно сравнить с использованием камеры видеонаблюдения, которая отображает на мониторе только текущую картинку, не сохраняя происходившие ранее события.

При отслеживании изменений требуется выяснение характера некорректных операций: умышленные ли это действия пользователей или проблемы, связанные с задержками в синхронизации (в силу особенностей архитектуры системы). Для этого, кроме самих измененных данных, необходимо знать их содержимое: основываясь на этом знании, пользователь мог бы поводить какие-либо изменения или же осуществлять иные фактические действия (возможно, даже вне информационной системы). Причем, поскольку в работе используются локальные копии данных, то необходимо знать содержимое данных не в самой СУБД, а в соответствующей ее локальной копии.

Еще больше ситуация усложняется тем, что наличие информации о состоянии данных в момент выполнения операций необходимо не только при изменении данных, но и при их чтении. В качестве характерного примера можно привести различного рода отчеты, формируемые на основании данных системы, существовавших в момент составления отчета. Определить в последующем источники формирования каждого сводного показателя отчета можно лишь при условии сохранения исходных данных. Дополнительной сложностью является то, что требуется отслеживать не только изменения, но и все исправления данных.

Использование информационной системы в качестве источника первичных данных практически всегда требует обеспечения юридической значимости информации, что достигается посредством электронной цифровой подписи. Сфера применения ЭЦП сегодня в основном ограничивается электронными документами, однако время требует не просто придания юридической значимости отдельным документам, передаваемым между организациями, а формирования полностью юридически значимого массива данных, любая выборка из которого также имеет юридическую силу. При этом каждое изменение данных (которое впоследствии могло служить основанием для других изменений) должно быть подписано осуществившим его пользователем.

Особенно актуальна данная проблема для государственных информационных систем, где каждый служащий имеет свои полномочия и несет соответствующую ответственность. Кроме того, трендом последних лет, особенно в сфере государственного управления, является увеличение количества функций, выполняемых без участия человека. В качестве примера здесь можно привести процесс выдачи различных выписок и справок из государственных регистров, для полноценной реализации которого решение перечисленных проблем является необходимым условием.

Отслеживание изменений данных не только становится желательным фактором, но и вызвано необходимостью соблюдать требования нормативных документов, регламентирующих порядок контроля изменений и ведения истории данных клиентов в течение длительного периода времени.

Способы управления данными

Прежде чем говорить о способах повышения эффективности управления данными в информационных системах, имеет смысл более подробно рассмотреть происходящие с ними процессы. При внимательном изучении можно обнаружить, что процесс существования данных включает в себя четыре типа жизненных циклов. Первый - это непосредственно жизненные циклы значений отдельных атрибутов объектов. Второй тип представляет собой жизненные циклы объектов в целом, описывающие такие события, как появление новых объектов и их исчезновение, а также их реорганизацию, композицию (объединение, присоединение) и декомпозицию (разделение, выделение). Третий и четвертый типы жизненных циклов - это циклы метаданных - классов объектов и их атрибутов. События, которые могут происходить с ними, аналогичны событиям, происходящим с объектами: появление, исчезновение, реорганизация, композиция и декомпозиция.

Большинство современных информационных систем строится на основе прямолинейного управления данными. При необходимости хранения информации о новой категории данных создается новая таблица, а когда такая необходимость исчезает, таблица удаляется, архивируется или просто прекращается ее использование. Когда появляется потребность хранить дополнительную характеристику об объектах, в таблицу добавляется новый столбец, а когда такая необходимость исчезает - столбец удаляется или перестает использоваться. Похожая ситуация и с хранением объектов. Операции композиции и декомпозиции реализуются посредством создания новых элементов и переноса данных. Что касается значений атрибутов объектов, то с ними все просто - они изменяются по необходимости.

При таком способе управления данными перечисленные задачи управления многопользовательским доступом к данным могут быть решены только с помощью дополнительных инструментальных средств. Причем следует отметить, что большинство современных СУБД обладают встроенным механизмом отслеживания изменений - журналом транзакций, однако доступ к его содержимому, как правило, ограничен только ядром СУБД, но даже при наличии доступа восстановление состояния на заданный момент времени, ввиду особенностей его структуры, является непростой задачей.

В качестве еще одного способа решения данной проблемы можно рассмотреть использование темпоральных (хронологических) баз данных. Но на сегодняшний день полноценные промышленные реализации таких баз, по сути, отсутствуют. Кроме того, они ориентированы на решение иных задач. Некоторые современные СУБД содержат специализированные механизмы, которые позволяют использовать фоновую версионность значений атрибутов (на основе все того же журнала транзакций), однако она далеко не всегда удобна в применении. Альтернативным вариантом является изменение самого подхода к управлению данными.

Технология хранения

Совершение любых операций пользователем в информационной системе - это поступление новой информации, которое не должно вести к уменьшению количества данных в базе данных. В этом смысле даже операция обновления далеко не безобидна, так как приводит к потере предшествующих значений, не говоря уже об операции удаления. Информационные сущности должны хранить информацию о всех указанных четырех жизненных циклах, а не повторять его.

Используя термины SQL, можно говорить, что для отражения прекращения существования объектов и изменения их характеристик недопустимо применение операторов delete и update. Эти операторы являются служебными и должны использоваться исключительно в служебных целях: для перемещения, архивации и утилизации массивов данных. Для того чтобы это стало возможным, необходимо, чтобы каждая запись базы данных представляла собой сведения о некотором событии (или его части): создании класса, разделении атрибутов, удалении объекта, изменении атрибута и т. д. Поскольку каждое такое событие будет относиться к одному из четырех перечисленных жизненных циклов, то и хранить сведения о них также имеет смысл в соответствующих четырех таблицах: Классы, Атрибуты, Объекты, Значения.

События, отражаемые в первых трех таблицах, - это сведения о переходе сущностей из одного состояния в другое. Запись, отражающая каждое такое событие, представляет собой вектор, описываемый двумя точками: предшествующим состоянием и текущим. Еще одним неотъемлемым элементом является штамп времени события, то есть это время, начиная с которого переход считается совершенным.

В качестве состояния имеет смысл использовать новый или существующий идентификатор сущности. Для обозначения пустоты, необходимой для отражения всех операций, кроме выделения, можно использовать null. Например, при создании сущности null выступает в качестве предшествующего состояния, а при удалении - в качестве текущего. Для отражения операций объединения, разделения, присоединения и реорганизации необходимо использовать несколько связанных записей событий.

В отличие от первых трех таблиц, записи таблицы Значения хранят не векторы, а лучи - значения атрибутов объектов начиная с некоторого момента времени. Столбцами данной таблицы являются: ссылка на объект, ссылка на атрибут, значение и время, начиная с которого используется данное значение.

Описанная технология позволяет упростить решение проблемы модернизации информационных систем, в частности - проблемы изменения используемых схем (структур) данных. Сегодня при их изменении существовавшие ранее данные, по сути, конвертируются в новый формат. Но, во-первых, конвертация не всегда достаточно простой процесс, а во-вторых, возникает проблема отсутствующей информации: при добавлении столбцов в таблицу, для ранее созданных записей соответствующие поля будут не заполнены, а прекращение использования столбца приводит к тому, что незаполненным данное поле будет для всех новых записей. Все это может приводить к нарушению заданных разработчиком ограничений целостности. Особенность предложенной технологии заключается в обеспечении возможности работы с данными прошлых периодов в соответствующей им схеме данных.

Управление доступом к данным

Для связи записей событий, описывающих одну операцию, имеет смысл использовать дополнительную таблицу - Транзакции, а во все остальные таблицы добавить столбец - ссылку на нее. Благодаря этому можно осуществлять связку событий (операций), составляющих с точки зрения согласованности данных единую транзакцию, а также значительно упростить корректный откат транзакций.

Следует отметить, что с учетом сказанного откат транзакций, так же как и все другие исправления, не должен проходить посредством изменения или удаления существующих записей. Для отражения операций исправления посредством операций вставки в дополнение ко времени актуальности данных (действительному времени), указываемому в записях таблиц Классы, Атрибуты, Объекты и Значения, необходимо использовать время записи данных (транзакционное время записи). Исправления фиксируются посредством добавления к существующей записи с неправильным значением новой записи с тем же временем актуальности, но с текущим временем записи данных (в связанной записи таблицы Транзакции) и исправленными значениями. Таким образом, при чтении используется запись с более поздним временем создания.

В многопользовательской среде для обеспечения полноценного отслеживания некорректных операций необходимо знать содержание данных локального кэша, то есть содержание данных на момент начала транзакции. Здесь существенной проблемой является временной разрыв между началом транзакции и ее окончанием. Под началом транзакции подразумевается чтение данных из СУБД в локальный кэш, а под ее окончанием - запись изменений. При использовании предложенной модели организации данных, для решения данной проблемы достаточно знать время чтения данных из СУБД в локальный кэш. Его целесообразно хранить в отдельном поле таблицы Транзакции.

Хранение данных в режиме «только вставка» позволяет также решить проблему отслеживания авторства всех изменений. Для этого соответствующие сведения аналогичным образом вносятся в записи таблицы Транзакции. Если при этом для всех связанных с записью транзакции на ключе пользователя рассчитать ЭЦП и сохранить ее в отдельное поле таблицы Транзакции, то можно придать юридическую значимость образуемого таким образом информационного массива, обеспечив при этом разделение ответственности между пользователями.

Описанный подход может быть применим при построении систем самого различного назначения, в первую очередь систем управления мастер-данными или нормативно-справочной информацией. В частности, использование этой технологии может решить множество проблем при построении одного из основных компонентов электронного правительства – Системы реестров государственных услуг.

Появление СУБД, анализирующих данные по колонкам, твердотельных накопителей и облачных технологий может существенно повлиять как на принципы построения баз данных, так и на дальнейшие пути развития методов бизнес-аналитики.

Сегодня к универсальным коммерческим СУБД с легкой руки некоторых видных представителей западных научных кругов прилепилось словечко legacy.



  • Цифровая трансформация стала основной темой обсуждений на недавней 22 ой конференции «ИТ в страховании». Участники сошлись во мнении, что внедрение и применение аналитических технологий для монетизации данных уже стало обязательным условием для качественных преобразований в отрасли.
  • IoT представляет собой мощный источник данных, который в сочетании с аналитикой может дать представление обо всем, от поведения до эмоций и здоровья. И вот почему это ключ к улучшению качества обслуживания клиентов.
  • Разработайте стратегию управления данными с использованием Data Lineage и дайте возможность ИИ полностью раскрыть свой потенциал.
  • Нет единого плана по работе над проектом по аналитике данных. Эксперт по технологиям Фил Саймон предлагает рассмотреть эти десять вопросов в качестве руководства.
  • Успешный data-driven бизнес способствует формированию целенаправленной, коллаборативной культуры; имеет лидеров, которые верят в данные и ориентированы на управление. Узнайте больше в этом кратком обзоре исследования TDWI, в котором раскрываются рекомендации для становления data-driven.
  • Самое время перейти к летней практике и рассмотреть такую распространенную и понятную задачу, как планирование севооборота. Что будет, если добавить в эту задачу щепоточку искусственного интеллекта и несколько граммов математических методов?
  • В конце весны SAS Россия впервые провела День стажера. Это новый формат встреч для студентов и выпускников, которые успешно прошли все этапы отбора на стажерскую программу SAS и уже начали работать в нашей команде.
  • Чтобы узнать больше о понятии «персональные данные», почему об этих данных говорят в новостях и почему они жестко регулируются Общим положением о защите данных (GDPR), мы пообщались с Джеем Экзэмом, юристом по вопросам конфиденциальности в SAS.
  • Как можно повысить эффективность бизнес-процессов, начиная с производства и заканчивая хранением и сбытом, с помощью информационных технологий?
  • Аналитика SAS поможет страховым компаниям Как применять углубленную аналитику и машинное обучение в медицинском страховании?
  • Подготовка данных - это процесс их объединения, приведения к единому формату и очистки с целью дальнейшего анализа и решения других бизнес-задач.
  • Качество данных не является хорошим или плохим, высоким или низким. Это диапазон или показатель работоспособности данных, проходящих через вашу организацию.
  • From cows to factory floors, the IoT promises intriguing opportunities for business. Find out how three experts envision the future of IoT.
  • Что же такое озеро данных? Это просто маркетинговый хайп? И вообще, чем оно отличается от традиционного хранилища данных?
  • Data profiling, the act of monitoring and cleansing data, is an important tool organizations can use to make better data decisions.


 

Возможно, будет полезно почитать: