데이터 관리 시스템. 데이터 관리 프로세스 데이터 세트의 특성

쿠키는 웹사이트의 특징과 기능을 활성화하는 귀하의 장치에 있는 작은 텍스트 파일입니다.

쿠키는 귀하의 언어 기본 설정 및 기타 유사한 정보를 기억하고 웹사이트의 특징과 기능을 활성화하기 위해 웹사이트가 귀하의 웹 브라우저에 요청하고 귀하의 장치에 저장하는 작은 텍스트 파일입니다.

Comindware에서는 귀하에 대해 수집하는 데이터와 이를 사용하는 방법을 명확하고 투명하게 공개하기 위해 노력합니다. 그리고 이 정책은 당사가 수집하는 쿠키와 귀하에 대한 데이터를 사용하는 방법에 대한 세부 정보를 제공합니다. 이 쿠키 정책은 Comindware 웹사이트에 적용됩니다.

항상 켜짐

귀하의 개인화된 경험을 보장하고 웹사이트가 제대로 작동하는지 확인하십시오.

항상 활성화되어 있는 쿠키는 귀하에게 개인화된 웹사이트 경험을 제공하는 데 도움이 되며 당사 시스템에서는 비활성화할 수 없습니다. 이러한 쿠키를 차단하거나 경고하도록 웹 브라우저를 설정할 수 있지만 이후에는 사이트의 일부가 작동하지 않을 수 있습니다.

웹사이트 속도

웹사이트의 지속적인 최적화 및 개선을 위해 사용됩니다.

성능 쿠키는 당사가 웹사이트를 지속적으로 최적화하고 개선하는 데 도움이 됩니다. 이러한 쿠키를 통해 당사는 웹사이트 추천 수를 계산하고, 트래픽 소스를 추적하고, 어떤 페이지가 가장 인기 있는지 파악하고, 방문자에게 가치를 제공하며, 사용자가 웹사이트를 탐색하는 방식을 이해할 수 있습니다. 모든 데이터는 이러한 쿠키에 집계된 형태로 수집되므로 익명으로 처리됩니다.

데이터 관리는 축적된 데이터를 수집, 저장, 처리, 해석하는 프로세스입니다. 오늘날 많은 기업에게 데이터 관리는 이미 수집된 데이터를 이해하고, 경쟁사를 "인식"하고, 예측 분석(예측)을 구축하고, 많은 비즈니스 질문에 답할 수 있는 훌륭한 기회입니다.

데이터 관리

데이터 관리에는 무엇이 포함되나요? 주요 프로세스를 나열해 보겠습니다.

데이터베이스 관리
ETL 프로세스(데이터 추출, 변환 및 로딩)
데이터 수집
데이터 보호 및 암호화
데이터 모델링
데이터 분석 자체

위의 내용을 바탕으로 성공적인 데이터 관리를 위해서는 다음이 필요하다는 것이 분명해졌습니다.

기술적 문제 해결(데이터베이스 선택, 데이터 저장 위치 결정(클라우드, 서버 등))
유능한 인재를 찾아보세요 :)

데이터 관리의 주요 과제

데이터를 수집, 저장, 해석할 때 발생하는 가장 일반적인 오류와 어려움은 다음과 같습니다.

불완전한 데이터
데이터의 "두 배 증가"(종종 서로 모순됨)
오래된 데이터

다양한 소스의 데이터를 연결하고 강화하며 비즈니스 인텔리전스 시스템에서 사용할 수 있도록 준비하는 데 도움이 되는 와 같은 제품은 데이터 로드 단계에서 많은 문제를 해결하는 데 도움이 될 수 있습니다.

데이터 분석

이미 적절한 양의 필요하고 중요한 데이터를 보유하고 있습니까? 이제 이를 저장하는 것 외에도 분석해야 합니다. 데이터 분석은 많은 비즈니스 질문에 답하고, 정보에 입각한 결정을 내리고, 고객을 "확인"하고, 창고 및 물류 프로세스를 최적화하는 데 도움이 됩니다. 일반적으로 데이터 분석은 모든 분야, 모든 회사, 모든 수준에서 중요하고 필요합니다.

데이터 분석 솔루션은 세 가지 주요 블록으로 구성됩니다.

데이터 저장소;
ETL 절차(데이터 추출, 변환 및 로딩)
보고 및 시각적 분석 시스템.

이 모든 것이 상당히 복잡해 보이지만 실제로는 그다지 무섭지 않습니다.

최신 분석 솔루션

분석가가 없는 기업은 어떻게 해야 할까요? 그리고 프로그래머-개발자는 없나요? 하지만 분석을 하고 싶은 욕구는 있습니다!

물론 해결책이 있습니다. 요즘 시장에는 분석을 위한 자동화 시스템이 충분히 있으며, 무엇이 중요합니까? – 데이터 시각화.

이러한 시스템(유형)의 장점은 무엇입니까?

빠른 구현 능력 (프로그램을 다운로드하여 최소한 노트북에 설치하십시오)
복잡한 IT나 수학적 지식이 필요하지 않습니다.
저렴한 비용(2018년 3월 기준 라이선스의 경우 월 RUB 2,000부터)

따라서 모든 회사는 이러한 분석 제품을 구현할 수 있습니다. 직원 수는 중요하지 않습니다. Tableau는 개인 기업가와 대기업 모두에게 적합합니다. 2018년 4월 UN은 Tableau를 전 세계 모든 사무실의 분석 플랫폼으로 선택했습니다.

이러한 자동화된 분석 시스템을 사용하는 회사는 이전에 작성하는 데 6시간이 걸렸던 테이블 형식 보고서가 Tableau에서 문자 그대로 10~15분 만에 수집된다는 점에 주목합니다.

나를 믿지 못합니까? 직접 사용해 보세요. Tableau 무료 평가판을 다운로드하고 프로그램 작업에 대한 교육 자료를 받아보세요.

Tableau 다운로드

Tableau Desktop 정식 버전을 14일 동안 무료로 다운로드하고 Tableau 비즈니스 분석 교육 자료를 선물로 받으세요.

데이터는 IT 서비스를 효과적으로 개발, 제공 및 유지하기 위해 관리해야 하는 가장 중요한 자산 중 하나입니다.

데이터/정보 관리는 조직이 데이터(정보)를 계획, 수집, 생성, 구성, 사용, 제어, 배포 및 폐기하는 방법과 관련된 모든 것이며, 이는 정형 및 비정형 데이터에 적용됩니다. 데이터 거버넌스는 내부 활동을 지원하고 고객에게 서비스를 제공하는 비즈니스 프로세스에 가치를 추가하기 위해 데이터/정보의 가치를 식별하고 사용하도록 보장합니다.

이 분야에서 일반적으로 사용되는 용어는 데이터 관리, 정보 관리 및 정보 자산 관리입니다. 본 발행물의 목적상 "데이터 관리"라는 용어는 위의 세 가지 모두를 약칭으로 사용합니다.

데이터 거버넌스의 역할은 단순히 원시 데이터를 관리하는 것이 아닙니다. 이는 함께 제공되는 모든 상황별 메타데이터(추가 "데이터에 대한 데이터")를 관리하는 것이며, 원시 데이터에 추가되면 "정보" 또는 "상황별 데이터"를 제공합니다.

조직 정보의 기초인 데이터는 자산 또는 자원으로 간주되는 데 필요한 모든 속성을 갖추고 있습니다. 예를 들어, 데이터는 "비즈니스 목표를 달성하고 조직의 성공적인 일상 운영"에 중요합니다. 또한, "조직에서 획득하고 보유할 수 있지만 금전적인 비용만 지불해야 합니다." 마지막으로, 아마도 다른 자원/자산과 함께 "조직의 목표를 더욱 달성"하는 데 사용될 것입니다.

성공적인 데이터 거버넌스의 핵심 요소는 다음과 같습니다.

모든 사용자는 다양한 채널을 통해 업무 수행에 필요한 정보에 접근할 수 있습니다.
조직 내 및 다른 조직과의 데이터 공유를 통해 귀중한 데이터가 충분히 활용됩니다.
조직의 데이터 품질은 허용 가능한 수준으로 유지되며 비즈니스에 사용되는 정보는 정확하고 신뢰할 수 있으며 일관됩니다.
개인 정보 보호, 보안, 기밀성 및 데이터 무결성에 대한 법적 요구 사항이 충족됩니다.
조직은 데이터 및 정보 처리 활동에서 높은 수준의 효율성과 효과성을 보장합니다.
엔터프라이즈 데이터 모델은 가장 중요한 엔터티와 그 관계를 정의합니다. 이는 이미 수년에 걸쳐 변경되는 아키텍처의 중복과 저하를 방지하는 데 도움이 됩니다.

데이터 자산 관리. 효과적인 데이터 관리가 없는 경우:

사람들은 필요하지 않은 데이터를 유지하고 수집합니다.
조직에는 사용되지 않는 기록 정보가 있을 수 있습니다.
조직은 잠재적인 사용자가 사용할 수 있는 많은 데이터를 저장할 수 있습니다.
정보는 필요한 것보다 많은 사람에게 또는 정보가 필요하지 않은 사람에게 제공될 수 있습니다.
조직은 데이터를 수집, 분석, 저장 및 검색하는 데 비효율적이고 오래된 방법을 사용할 수 있습니다.
조직은 필요한 데이터를 수집하지 못하고, 품질을 저하시키며, 예를 들어 관련 데이터 소스 간의 데이터 무결성을 잃을 수 있습니다.

또한, “정보가 정말 좋은 품질의 데이터에서 나온 것인가?”라는 질문에는 비교할 지표가 없기 때문에 답하기가 어렵습니다. 예를 들어, 열악한 데이터 품질은 입력 및/또는 업데이트 절차의 잘못된 확인으로 인해 발생하는 경우가 많습니다. 부정확하거나 불완전한 데이터가 IT 시스템에 입력되면 해당 데이터를 사용하여 생성된 모든 보고서에는 이러한 부정확성과 격차가 반영됩니다.

중앙 데이터를 신뢰할 수 없기 때문에 생성 및 사용되는 다양한 운영 및 기타 여러 내부 시스템에서 생성된 정보에 일관성이 부족할 수도 있습니다.

데이터 품질을 향상시키는 한 가지 방법은 정책과 표준을 설정하고, 전문 지식을 제공하며, 새로운 서비스에 대한 데이터 관련 측면의 처리를 용이하게 하는 데이터 관리 프로세스를 사용하는 것입니다.

이는 완전한 데이터/정보 자산 관리를 제공해야 합니다.

고객에게 제공되는 서비스의 가치를 높입니다.
비즈니스 위험을 줄입니다.
비즈니스 프로세스 비용 절감
내부 비즈니스 프로세스의 혁신을 촉진합니다.

데이터 관리 범위

데이터/정보 관리 범위에는 네 가지 관리 영역이 포함됩니다.

데이터 리소스 관리: 조직의 정보 거버넌스는 이러한 모든 리소스가 알려져 있고 데이터 소유권 및 메타데이터를 포함하여 리소스를 관리할 책임 있는 개인이 할당되도록 해야 합니다.

이 프로세스는 일반적으로 데이터 관리라고 하며 다음 사항에 대한 책임을 포함합니다.

정보 요구 사항 결정
- 데이터 인벤토리 및 기업 데이터 모델 구축
- 중복 및 데이터 결함 식별
- 정보 콘텐츠(데이터/정보 콘텐츠)의 카탈로그/색인 지원
- 조직 데이터의 비용과 가치를 측정합니다.

데이터/정보 기술 관리: 데이터베이스 설계 및 데이터베이스 관리와 같은 프로세스를 포함하여 조직의 정보 시스템을 지원하는 IT 부서의 관리입니다. 이러한 측면은 일반적으로 IT 부서 전문가가 처리합니다.

정보 프로세스 관리: 비즈니스 프로세스는 IT 서비스가 데이터를 사용하도록 유도합니다. 데이터 생성, 수집, 액세스, 수정, 저장, 삭제 및 보관 프로세스, 즉 데이터 수명주기 프로세스는 종종 애플리케이션 관리 프로세스와 함께 적절하게 제어되어야 합니다.

데이터 표준 및 정책 관리: 조직은 IT 개발 전략의 일부로 데이터 관리 표준 및 정책을 정의해야 합니다. 이 정책은 조직의 정보 시스템을 지원하는 IT 인프라에 적용될 조직의 데이터 관리 절차 및 책임, 기술 정책, 아키텍처 및 표준을 관리합니다.

모범 사례에 따르면 데이터 관리 프로세스의 범위에는 기존 데이터베이스 시스템에 포함되지 않은 비정형 데이터(예: 텍스트, 이미지, 사운드 등의 형식 사용) 관리가 포함됩니다. 데이터 거버넌스 프로세스는 요구 사항 수집부터 수명 종료까지 데이터 수명 주기의 모든 단계에서 품질을 보장하는 역할도 합니다. 이 간행물의 초점은 요구사항 수집, 자산 설계 및 개발 단계, 서비스 수명주기에서 데이터 관리의 역할에 있습니다.

데이터 거버넌스 프로세스를 지원하는 팀은 비즈니스 정보 헬프 데스크를 제공할 수도 있습니다. 그런 다음 메타데이터를 관리하므로 조직 내 데이터의 의미, 형식 및 유용성에 대한 질문에 답할 수 있습니다. 또한 필요한 비즈니스 프로세스를 수행하는 데 필요한 외부 데이터가 무엇인지 이해하고 설명할 수 있으며, 외부 데이터 원본을 사용할 수 있도록 필요한 조치를 취할 수 있습니다.

프로세스를 생성하거나 재설계하고 IT 서비스를 지원할 때 조직의 다양한 영역에서 데이터와 메타데이터의 재사용을 고려하는 것이 우수 사례라는 점을 이해하는 것이 매우 중요합니다. 이를 수행하는 기능은 엔터프라이즈 데이터 모델(공통 정보 모델이라고도 함)을 통해 지원될 수 있습니다. 재사용 지원은 데이터 관리의 주요 과제 중 하나인 경우가 많습니다.

2010년 9월 11일 세르게이 리진

지난 10년 동안 정보 시스템은 조용히 질적 진화의 변화를 겪었고, 오늘날 각 개별 시스템은 많은 사람들의 상호 작용을 보장하는 본격적인 비즈니스 환경을 나타냅니다. 그럼에도 불구하고 많은 건설 기술은 동일하게 유지되며 이는 보이는 것처럼 항상 무해하지는 않습니다. 정보 시스템을 손쉽게 현대화하고 데이터 구조를 변경하기 위한 다양한 방법이 제안될 수 있습니다.

정보의 양이 증가함에 따라 기업의 비즈니스 프로세스에 변화가 필요해졌습니다. 정보 시스템이 기본 소스 종이 문서의 정보만 처리하는 기존의 종이 중심 상호 작용은 기본 소스가 정보 시스템 자체, 더 정확하게는 정보 시스템에서 수행되는 사용자 작업인 전자 중심 시스템으로 대체되고 있습니다. 전자 디지털 서명 기술의 출현으로 전자 문서에 법적 중요성을 부여할 수 있게 되었지만 이러한 종류의 시스템이 안정적이고 안전하게 작동하도록 보장하는 작업 범위가 훨씬 더 넓어졌습니다.

다중 사용자 시스템 문제

대부분의 현대 기업 정보 시스템은 관계형 데이터베이스 서버를 기반으로 하는 다중 사용자 시스템입니다. 이러한 시스템의 사용자는 하나 이상의 조직의 직원일 수도 있고 해당 조직의 고객(개인 및 법인)일 수도 있습니다. 주어진 시간에 사용자가 시스템에서 개별 작업(기능적으로나 선언적으로 제한됨)을 수행할 수 있는 능력은 해당 시점에 시스템에 포함된 데이터에 따라 달라집니다. 여기서 발생하는 데이터에 대한 동시 액세스 관리 문제는 일반적으로 OLTP 기술을 사용하여 해결됩니다.

그러나 트랜잭션과 추가 검사를 통해 모든 동시성 문제를 프로그래밍 방식으로 피할 수 있는 것은 아닙니다. 가장 큰 문제는 인적 요소입니다. 각 사용자는 DBMS의 데이터를 직접 사용하지 않고 일부 로컬 복사본을 클라이언트 애플리케이션에 로드하여 작업합니다. 또한 원자성 작업을 구성하는 데이터의 사용자 읽기 및 쓰기 순서를 프로그래밍 방식으로 식별하는 것은 불가능합니다. 결과적으로, 읽기 데이터가 변경될 때 이러한 트랜잭션을 "롤백"하는 것은 불가능합니다. 시스템은 사용자의 최근 작업 중 얼마나 많은 것이 하나의 전체를 형성하는지, 사용자가 읽은 데이터 중 어떤 것을 고려했는지 결정할 수 없습니다. 결정을 내릴 때.

그 결과, 사용자의 적극적인 참여 없이 미리 정해진 알고리즘에 따라 백그라운드에서 애플리케이션 서버나 데이터베이스 서버에서 수행되는 서버측 데이터 처리 작업에 대해서만 트랜잭션이 유효한 것으로 나타났다. 물론 각 사용자 작업이 별도의 트랜잭션을 나타내는 방식으로 시스템 아키텍처를 설계할 수 있으며, 그 안에서 가능한 모든 데이터 일관성 검사가 수행됩니다(즉, 사용자가 트랜잭션을 시작했다는 사실과 매개변수 전달된 데이터는 트랜잭션의 일부로 확인되지 않은 시스템에서 사용자가 읽은 데이터를 기반으로 해서는 안 됩니다. 그러나 모든 인간 점검이 항상 쿼리 언어로 쉽게 설명될 수 있는 것은 아닙니다. 또한 이는 복잡성을 크게 증가시켜 개발 비용을 증가시킵니다.

반면, 데이터 일관성 측면에서 높은 수준의 신뢰성을 보장하는 것은 OLTP 모드에서 관리를 구성할 수 있는 가장 중요한 데이터 범주 중 일부에만 중요합니다. 다른 범주의 데이터의 경우 정보 보안 보장은 최신 항목뿐만 아니라 모든 이전 항목까지 사용자가 변경한 모든 변경 사항을 추적하도록 구성하는 것으로 귀결될 수 있습니다.

기록이 있는 데이터

오늘날에는 데이터베이스를 구축할 때 현재 데이터만 저장하는 원칙이 거의 보편적으로 사용됩니다. 디스크 공간 및 컴퓨팅 성능이 부족한 상황에서 매우 관련성이 높은 이 접근 방식은 오늘날 어떤 면에서는 이전에 발생한 이벤트를 저장하지 않고 현재 사진만 모니터에 표시하는 비디오 감시 카메라를 사용하는 것과 비교할 수 있습니다.

변경 사항을 추적할 때 잘못된 작업의 성격, 즉 사용자의 의도적인 작업인지 아니면 동기화 지연과 관련된 문제인지(시스템 아키텍처의 특성으로 인해) 판단해야 합니다. 이를 위해서는 변경된 데이터 자체 외에도 해당 내용을 알아야 합니다. 이 지식을 바탕으로 사용자는 변경을 수행하거나 다른 실제 작업을 수행할 수 있습니다(아마도 정보 시스템 외부에서도). 더욱이 작업은 데이터의 로컬 복사본을 사용하기 때문에 DBMS 자체가 아닌 해당 로컬 복사본에 있는 데이터의 내용을 알아야 합니다.

데이터를 변경할 때뿐만 아니라 읽을 때에도 작업 시 데이터 상태에 대한 정보의 가용성이 필요하다는 사실로 인해 상황은 더욱 복잡해집니다. 대표적인 예로 보고서 작성 당시 존재했던 시스템 데이터를 기반으로 생성된 다양한 유형의 보고서를 들 수 있습니다. 이후 원본 데이터가 보존되는 경우에만 보고서의 각 요약 지표의 형성 출처를 확인할 수 있습니다. 추가적인 복잡성은 데이터의 변경 사항뿐만 아니라 모든 수정 사항도 추적해야 한다는 것입니다.

기본 데이터의 소스로 정보 시스템을 사용하려면 거의 항상 전자 디지털 서명을 통해 정보의 법적 중요성을 보장해야 합니다. 오늘날 디지털 서명의 적용 범위는 주로 전자 문서로 제한되지만 조직 간에 전송되는 개별 문서에 법적 중요성을 부여하는 것뿐만 아니라 법적 효력이 있는 모든 샘플과 함께 완전히 법적으로 중요한 데이터 배열을 형성하는 데 시간이 필요합니다. 또한 각 데이터 변경(이후 다른 변경의 기초가 될 수 있음)은 이를 수행한 사용자가 서명해야 합니다.

이 문제는 특히 각 직원이 자신의 권한을 갖고 그에 상응하는 책임을 지는 정부 정보 시스템과 관련이 있습니다. 또한, 최근 특히 공공행정 분야에서는 인간의 개입 없이 수행되는 기능이 늘어나고 있는 추세이다. 여기에 있는 예는 나열된 문제의 해결이 필요한 조건인 전체 구현을 위해 주 등록부에서 다양한 추출물과 인증서를 발급하는 프로세스입니다.

데이터 변경 사항을 추적하는 것은 바람직한 요소가 될 뿐만 아니라 변경 사항을 제어하고 장기간에 걸쳐 고객 데이터 기록을 유지하는 방법을 규제하는 규제 요구 사항을 준수해야 할 필요성에 의해 추진됩니다.

데이터 관리 방법

정보 시스템에서 데이터 관리 효율성을 향상시키는 방법에 대해 이야기하기 전에 정보 시스템에서 발생하는 프로세스를 더 자세히 고려하는 것이 좋습니다. 자세히 살펴보면 데이터 존재 과정에는 네 가지 유형의 수명주기가 포함되어 있음을 알 수 있습니다. 첫 번째는 개별 개체 속성 값의 직접적인 수명주기입니다. 두 번째 유형은 일반적으로 객체의 생명주기를 나타내며, 새로운 객체의 출현 및 소멸, 재구성, 구성(합병, 가입) 및 분해(분리, 분리)와 같은 이벤트를 설명합니다. 세 번째 및 네 번째 유형의 수명 주기는 메타데이터 주기(객체 클래스 및 해당 속성)입니다. 그들에게 일어날 수 있는 사건들은 사물에게 일어나는 사건들, 즉 출현, 소멸, 재구성, 구성, 분해와 유사하다.

대부분의 현대 정보 시스템은 간단한 데이터 관리를 기반으로 구축되었습니다. 새로운 데이터 카테고리에 대한 정보를 저장해야 할 경우 새로운 테이블을 생성하고, 그러한 필요성이 사라지면 해당 테이블을 삭제하거나 보관하거나 단순히 사용을 중지합니다. 객체에 대한 추가 특성을 저장할 필요가 있을 때 테이블에 새로운 컬럼이 추가되고, 그러한 필요성이 사라지면 해당 컬럼은 삭제되거나 사용이 중단됩니다. 상황은 객체를 저장하는 것과 유사합니다. 구성 및 분해 작업은 새로운 요소를 생성하고 데이터를 전송하여 구현됩니다. 객체 속성의 값은 모든 것이 간단하며 필요에 따라 변경됩니다.

이 데이터 관리 방법을 사용하면 나열된 데이터에 대한 다중 사용자 액세스 관리 작업을 추가 도구를 통해서만 해결할 수 있습니다. 또한 대부분의 최신 DBMS에는 변경 사항을 추적하기 위한 메커니즘이 내장되어 있습니다. 즉, 트랜잭션 로그이지만 해당 내용에 대한 액세스는 일반적으로 DBMS 커널로만 제한되지만 액세스하더라도 구조의 특성상 특정 시점까지 상태를 유지하는 것은 쉬운 일이 아닙니다.

이 문제를 해결하는 또 다른 방법으로 시간(연대순) 데이터베이스의 사용을 고려할 수 있습니다. 그러나 오늘날에는 그러한 기반을 본격적으로 산업적으로 구현하는 것이 본질적으로 없습니다. 또한 그들은 다른 문제를 해결하는 데 중점을 둡니다. 일부 최신 DBMS에는 속성 값의 백그라운드 버전 관리(동일한 트랜잭션 로그 기반)를 사용할 수 있는 특수 메커니즘이 포함되어 있지만 사용하기가 항상 편리한 것은 아닙니다. 대안은 데이터 관리 자체에 대한 접근 방식을 바꾸는 것입니다.

저장 기술

정보 시스템에서 사용자의 작업 수행은 새로운 정보를 수신하는 것이므로 데이터베이스의 데이터 양이 감소해서는 안됩니다. 이런 의미에서 업데이트 작업은 삭제 작업은 물론이고 이전 값의 손실로 이어지기 때문에 무해하지 않습니다. 정보 개체는 이 네 가지 수명 주기에 대한 정보를 반복하지 않고 모두 저장해야 합니다.

SQL 용어를 사용하면 개체 존재의 중단과 특성 변경을 반영하기 위해 삭제 및 업데이트 연산자를 사용할 수 없다고 말할 수 있습니다. 이러한 운영자는 서비스 운영자이며 데이터 세트 이동, 보관 및 재활용과 같은 공식적인 목적으로만 사용해야 합니다. 이것이 가능하려면 각 데이터베이스 레코드가 클래스 생성, 속성 분할, 객체 삭제, 속성 변경 등 일부 이벤트(또는 그 일부)에 대한 정보를 나타내야 합니다. 등. 이러한 각 이벤트는 나열된 네 가지 수명 주기 중 하나와 관련되므로 해당 이벤트에 대한 정보를 해당 네 가지 테이블(클래스, 속성, 개체, 값)에 저장하는 것도 의미가 있습니다.

처음 세 테이블에 반영된 이벤트는 한 상태에서 다른 상태로의 엔터티 전환에 대한 정보입니다. 이러한 각 이벤트를 반영하는 레코드는 이전 상태와 현재 상태라는 두 지점으로 설명되는 벡터입니다. 또 다른 필수 요소는 이벤트의 타임스탬프입니다. 즉, 전환이 완료된 것으로 간주되는 시간입니다.

새로운 엔터티 식별자나 기존 엔터티 식별자를 상태로 사용하는 것이 합리적입니다. Null은 선택을 제외한 모든 작업을 반영하는 데 필요한 공백을 나타내는 데 사용할 수 있습니다. 예를 들어 엔터티가 생성되면 null이 이전 상태로 작동하고, 삭제되면 현재 상태로 작동합니다. 병합, 분할, 추가 및 재구성 작업을 기록하려면 여러 관련 이벤트 레코드를 사용해야 합니다.

처음 세 테이블과 달리 값 테이블의 항목은 벡터가 아니라 광선(특정 시점부터 시작하는 객체 속성 값)을 저장합니다. 이 테이블의 열은 객체 참조, 속성 참조, 값 및 이 값이 사용되는 시간입니다.

설명된 기술을 사용하면 정보 시스템 현대화 문제, 특히 사용된 데이터 체계(구조) 변경 문제에 대한 솔루션을 단순화할 수 있습니다. 오늘날 데이터가 변경되면 기존 데이터는 본질적으로 새로운 형식으로 변환됩니다. 그러나 첫째, 변환이 항상 매우 간단한 프로세스는 아니며 둘째, 정보 누락 문제가 발생합니다. 테이블에 열을 추가할 때 이전에 생성된 레코드의 경우 해당 필드가 채워지지 않고 사용이 중지됩니다. 열은 이 데이터가 필드에 채워지지 않았다는 사실로 이어지며 모든 새 항목에 대한 것입니다. 이 모든 것은 개발자가 지정한 무결성 제한 사항을 위반할 수 있습니다. 제안된 기술의 특징은 해당 데이터 스키마에서 과거 데이터로 작업할 수 있는 기능을 제공하는 것입니다.

데이터 접근 제어

하나의 작업을 설명하는 이벤트 레코드를 연결하려면 추가 테이블(트랜잭션)을 사용하고 다른 모든 테이블에 열(링크)을 추가하는 것이 좋습니다. 덕분에 데이터 일관성의 관점에서 단일 트랜잭션을 구성하고 트랜잭션의 올바른 롤백을 크게 단순화하는 여러 이벤트(작업)를 수행할 수 있습니다.

즉, 다른 모든 수정 사항과 마찬가지로 트랜잭션 롤백은 기존 기록을 수정하거나 삭제하여 수행해서는 안 된다는 점에 유의해야 합니다. Insert 연산을 통해 수정 연산을 반영하려면 Classes, Attributes, Objects, and 의 레코드에 지정된 데이터가 최신 상태였던 시간(유효 시간) 외에 데이터가 작성된 시간(트랜잭션 쓰기 시간)을 사용해야 합니다. 값 테이블. 관련 시간은 동일하지만 데이터 레코드의 현재 시간(연관된 거래 테이블 레코드에 있음)과 수정된 값을 사용하여 잘못된 값이 있는 기존 레코드에 새 레코드를 추가하여 수정 사항을 기록합니다. 따라서 읽을 때 생성 시간이 늦은 레코드가 사용됩니다.

다중 사용자 환경에서 잘못된 작업을 완벽하게 추적하려면 로컬 캐시 데이터의 내용, 즉 트랜잭션이 시작된 당시의 데이터 내용을 알아야 합니다. 여기서 중요한 문제는 트랜잭션 시작과 종료 사이의 시간 지연입니다. 트랜잭션의 시작은 DBMS에서 로컬 캐시로 데이터를 읽는 것을 의미하고, 트랜잭션의 끝은 변경 사항을 쓰는 것을 의미합니다. 제안된 데이터 구성 모델을 사용할 때 이 문제를 해결하려면 DBMS에서 로컬 캐시로 데이터를 읽는 데 걸리는 시간을 아는 것으로 충분합니다. 이를 Transactions 테이블의 별도 필드에 저장하는 것이 좋습니다.

삽입 전용 모드로 데이터를 저장하면 모든 변경 사항의 작성자를 추적하는 문제도 해결됩니다. 이를 위해 관련 정보가 동일한 방식으로 거래 테이블 항목에 입력됩니다. 동시에 사용자 키의 기록과 관련된 모든 거래에 대해 디지털 서명이 계산되어 거래 테이블의 별도 필드에 저장되면 이렇게 형성된 정보 배열에 법적 의미를 부여할 수 있습니다. 사용자 간의 책임 분배를 보장합니다.

설명된 접근 방식은 주로 마스터 데이터 또는 참조 정보를 관리하기 위한 시스템과 같이 다양한 목적으로 시스템을 구축할 때 적용할 수 있습니다. 특히, 이 기술을 사용하면 전자정부의 주요 구성 요소 중 하나인 공공 서비스 등록 시스템을 구축할 때 많은 문제를 해결할 수 있습니다.

열별로 데이터를 분석하는 DBMS, 솔리드 스테이트 드라이브 및 클라우드 기술의 출현은 데이터베이스 구성 원칙과 비즈니스 분석 방법의 추가 개발에 큰 영향을 미칠 수 있습니다.

오늘날 서구 과학계의 몇몇 저명한 대표자들의 가벼운 손길 덕분에 레거시(legacy)라는 단어가 보편적인 상용 DBMS에 붙게 되었습니다.

최근 열린 제22차 IT in Insurance 컨퍼런스에서는 디지털 전환이 주요 논의 주제였습니다. 참가자들은 데이터 수익화를 위한 분석 기술의 도입과 사용이 이미 업계의 질적 변화를 위한 전제조건이 되었다는 데 동의했습니다.
IoT는 분석과 결합될 때 행동부터 감정, 건강까지 모든 것에 대한 통찰력을 제공할 수 있는 강력한 데이터 소스입니다. 이것이 바로 고객 경험을 개선하는 것이 핵심인 이유입니다.
Data Lineage를 사용하여 데이터 관리 전략을 개발하고 AI가 잠재력을 최대한 발휘할 수 있도록 지원하세요.
데이터 분석 프로젝트 작업에 대한 단일 계획은 없습니다. 기술 전문가인 필 사이먼(Phil Simon)은 다음 10가지 질문을 지침으로 삼을 것을 제안합니다.
성공적인 데이터 기반 비즈니스는 집중적이고 협업적인 문화를 조성합니다. 데이터를 믿고 관리 지향적인 리더가 있습니다. 데이터 기반이 되기 위한 권장 사항을 보여주는 이 TDWI 연구 요약에서 자세히 알아보세요.
이제 여름 연습으로 이동하여 작물 순환 계획과 같은 일반적이고 이해하기 쉬운 작업을 고려할 때입니다. 이 작업에 약간의 인공 지능과 몇 그램의 수학적 방법을 추가하면 어떻게 될까요?
봄이 끝날 무렵 SAS Russia는 첫 번째 Trainee Day를 개최했습니다. 이는 SAS 인턴십 프로그램 선택의 모든 단계를 성공적으로 통과하고 이미 SAS 팀에서 일하기 시작한 학생 및 졸업생을 위한 새로운 형식의 회의입니다.
개인 데이터의 개념, 그것이 뉴스에 나오는 이유, 일반 데이터 보호 규정(GDPR)에 의해 엄격하게 규제되는 이유에 대해 자세히 알아보기 위해 SAS의 개인 정보 보호 변호사인 Jay Exham과 이야기를 나누었습니다.
정보 기술을 사용하여 생산부터 보관, 유통까지 비즈니스 프로세스의 효율성을 어떻게 향상시킬 수 있습니까?
SAS 분석은 보험사에 도움이 될 것입니다건강 보험에 고급 분석 및 기계 학습을 적용하는 방법은 무엇입니까?
데이터 준비는 추가 분석 및 기타 비즈니스 문제 해결을 위해 데이터를 결합하고 단일 형식으로 만들고 정리하는 프로세스입니다.
데이터 품질은 좋고 나쁨, 높거나 낮음이 아닙니다. 이는 조직을 통해 흐르는 데이터의 범위 또는 상태 표시기입니다.
소부터 공장 현장까지 IoT는 흥미로운 비즈니스 기회를 약속합니다. 세 명의 전문가가 IoT의 미래를 어떻게 구상하는지 알아보세요.
데이터 레이크란 무엇입니까? 이것은 단지 마케팅 과대 광고입니까? 일반적으로 기존 데이터 웨어하우스와 어떻게 다릅니까?
데이터를 모니터링하고 정리하는 행위인 데이터 프로파일링은 조직이 더 나은 데이터 결정을 내리는 데 사용할 수 있는 중요한 도구입니다.

다음 내용을 읽어보는 것이 도움이 될 수 있습니다.