본문 바로가기
카테고리 없음

[ADP]데이터의 이해

by 현실남자 2023. 6. 29.

 


이번 포스팅에서는 데이터 이해 과목의 전반적인 내용에 대해 알아보고 데이터의 이해 장의 세부 내용에 대해 공부해보겠습니다.

데이터 이해 과목의 세부 과목은 아래와 같습니다.
데이터 이해 과목에서는 객관식 10개 문항이 출제되며, 과목별 40% 미만 취득 시 과락이기 때문에 4개 이상 문제를 반드시 맞혀야 합니다.

데이터의 이해

ADsP 시험을 봤던 경험과 기출문제를 기반으로 출제될 것으로 예상되는 내용에 대해서 작성해 보겠습니다.
 

1장 데이터의 이해

1절. 데이터와 정보

데이터란? 데이터는 개별 데이터 자체로는 중요하지 않은 객관적인 사실이라는 당위적 특성과
추론, 예측, 전망, 추정을 위한 근거로 기능하는 당위적 특성을 갖고 있습니다.
또한 다른 객체와의 상호 관계 속에서 가치를 갖게 됩니다.
이러한 데이터 정의는 중요하지만 실질적으로 아래 두 가지 데이터 유형에 대한 문제가 많이 출제되고 있습니다.
두 가지 특성에 대한 예시를 암기하면 도움이 될 것으로 생각됩니다.
    1) 정성적 데이터 : 비정형데이터, 주관적 내용, 통계분석이 어려움
        - 예시 : 언어, 문자(설문조사의 주관식 응답, SNS에 올린 글, 기상특보)
    2) 정량적 데이터 : 정형데이터, 객관적 내용, 통계분석이 용이함
        - 예시 : 수치, 기호, 도형으로 표시(지역별 온도, 풍속, 강수량)
 
또 다른 분류 방식으로 아래 3가지 방식도 있습니다.
    1) 정형(Structured) 데이터 : 정형화된 구조가 있으며, 연산이 가능한 데이터
         - 예시 : CSV, 엑셀, 스프레드 시트, 관계형 데이터베이스 등
    2) 반 정형(Semi-Structured) 데이터 : 정형화된 구조는 있으나, 연산이 불가능한 데이터
         - 예시 : XML, JSON, HTML, 센서 데이터 등
    3) 비정형(Unstructured) 데이터 : 정형화된 구조가 없으며, 연산이 불가능한 데이터
         - 예시 : 소셜네트워크 데이터, 댓글, 영상, 음성 등
 
데이터는 또한 지식경영의 핵심 이슈인 암묵지(tacit knowledge)와 형식지(explicit knowledge)의 상호작용에 있어 중요한 역할을 합니다. 이러한 암묵지와 형식지 사이의 관계를 나타내는 SEMI Model을 암기해 두고 특정 예시가 공통화, 표출화, 연결화, 내면화 중 어떤 것을 나타내는지 맞히는 문제가 출제됩니다.
 
기출문제. 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정은? 답: 3번 표출화
1번. 연결화  2번. 내면화  3번. 표출화  4번. 공통화
 

SECI Model

 
DIKW의 정의
데이터(Data): 관찰, 측정을 통해서 수집된 사실이나 값, 수치, 문자 등 가공되지 않은 원본 데이터
                      (예시) : A마트 펜 500원, 연필 200원, 라면 3000원 B마트 연필 300원
정보(Information) : 데이터 중 사용자가 필요로 하는 데이터, 사용자의 필요에 의해 정제 및 가공된 데이터.
                      (예시) A마트의 연필 가격이 더 저렴함
지식(Knowledge) : 정보를 일반화하고 체계화하여 즉시 적용 및 활용 가능한 형태, 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물(예시) 연필을 살 때는 A마트로 가는 것이 유리
지혜(Wisdom) : 지식에 유연성을 더하고, 상황이나 맥락에 맞게 규칙을 적용하는 것, 근본원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어 (예시) A마트의 다른 상품들도 B마트보다 쌀 것이라고 예측
 

2절. 데이터베이스 정의와 특징

데이터베이스에 대한 여러 정의가 있지만, 오라클 사이트에서 정의한 내용을 발췌했습니다.
데이터베이스는 구조화된 정보 또는 데이터의 조직화된 모음으로서 일반적으로 컴퓨터 시스템에 전자적으로 저장됩니다. 데이터베이스는 일반적으로 데이터베이스 관리 시스템(DBMS)에 의해 제어됩니다. 연결된 애플리케이션과 함께 데이터와 DBMS를 하나로 묶어 데이터베이스 시스템이라고 하며 단축하여 데이터베이스라고 합니다.


오늘날 운영되고 있는 가장 일반적인 유형의 데이터베이스에서 데이터는 일반적으로 처리 및 데이터 쿼리를 효율적으로 수행하기 위해 일련의 테이블에서 행과 열로 모델링 됩니다.그러면 데이터에 쉽게 액세스 하고 관리, 수정, 업데이트, 제어 및 구성할 수 있습니다.


추가로, 국내 컴퓨터 용어사전의 정의는 동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합을 의미합니다.
 
데이터베이스의 특징으로는 아래 4가지 특징이 있습니다.
통합된 데이터(Integrated data) : 동일한 내용의 데이터가 중복되지 않는다는 것을 의미합니다.
저장된 데이터(Stored data) : 컴퓨터가 접근할 수 있는 저장매체에 저장되어 사용자나 응용 시스템이 언제든지 이용할 수 있는 데이터 집합
공용 데이터(Shared data) : 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미합니다.
변화되는 데이터(Changeable data) : 데이터베이스에 저장된 내용은 곧 데이터베이스의 현시점에서의 상태를 나타내며, 이 상태는 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 항상 변하면서도 항상 현재의 정확한 데이터를 유지해야 함을 의미합니다.
 

3절. 데이터베이스의 활용

1. OLTP(On-Line Transaction Processing)
OLTP(온라인 트랜잭션 처리)는 온라인 뱅킹, 쇼핑, 주문 입력 또는 텍스트 메시지 전송 등 동시에 발생하는 다수의 트랜잭션을 실행하는 데이터 처리 유형입니다. 이러한 트랜잭션은 전통적으로 경제 또는 재무 트랜잭션이라고 칭하며, 기업이 회계 또는 보고 목적으로 언제든 정보에 액세스 할 수 있도록 기록 및 보호됩니다.
과거에 OLTP는 화폐, 제품, 정보, 서비스 요청 등 일종의 교환이 이루어지는 실제 상호작용에만 한정적으로 적용되었습니다. 하지만 이와 같은 맥락에서의 트랜잭션의 정의는 지난 몇 년간 확대되었고, 특히 인터넷의 등장으로 인해 모든 웹 연결 센서를 통한 전 세계 모든 곳에서 발생하는 모든 종류의 디지털 상호작용 또는 비즈니스 거래를 포함하게 되었습니다. 또한 웹페이지에서 pdf 다운로드하기, 특정 비디오 시청하기 등 모든 종류의 행동과 비즈니스가 고객에게 더 나은 서비스를 제공하기 위해 기록하는 소셜 채널 자동 유지관리 트리거 또는 댓글 등 모든 종류의 상호작용을 포함합니다.
2. OLAP(On-Line Analytical Processing)
데이터 웨어하우스, 데이터 마트 또는 기타 중앙화된 통합 데이터 저장소의 대용량 데이터를 고속으로 다차원 분석하는 소프트웨어입니다.
대부분의 비즈니스 데이터에는 여러 차원, 즉 프레젠테이션, 추적 또는 분석을 위해 데이터를 분류하는 기준인 여러 범주가 있습니다. 예를 들어 매출 수치에는 위치(지역, 국가, 주/도, 매장), 시간(연,월,주,일), 제품(의료, 남성/여성/아동, 브랜드, 유형)과 관련된 여러 차원이 있을 수 있습니다.
그러나 데이터 웨어하우스의 데이터 세트는 테이블에 저장되며, 각 테이블은 데이터를 한 번에 두 개의 차원으로만 구성할 수 있습니다. OLAP는 여러 관계형 데이터 세트에서 데이터를 추출한 후 매우 빠른 처리와 분석을 위해 다차원 형식으로 재구성하여 유용한 인사이트를 도출합니다.
   ※ OLTP와와 OLAP의 차이는?
       OLTP는 여러 사람이 다수의 트랜잭션을 실시간으로 실행할 수 있게 해주는 반면, OLAP(온라인 분석 처리)는
       일반적으로 분석을 목적으로 데이터베이스 내의 트랜잭션(레코드라고도 불림)을 질의하는 작업을 포함합니다.
       OLAP는 기업이 트랜잭션 데이터로부터 더 많은 인사이트를 추출하여 양질의 정보를 기반으로 한 의사결정을
       내리는 데 활용할 수 있게 해 줍니다.
3.CRM(Customer Relationship Management) : Microsoft 정의
CRM(고객 관계 관리)는 회사의 현재 고객 및 잠재 고객과 관련된 정보를 관리, 추적, 저장하도록 지원하는 일련의 데이터 기반 소프트웨어가 통합된 설루션입니다.이러한 정보를 중앙 집중식 시스템에 보관하면 비즈니스 팀은 필요한 인사이트에 즉시 액세스할 수 있습니다.
4.SCM(Supply Chain Management)
공급망 관리를 뜻하는 말로 원자재 조달에서 마지막 단계인 제품 배송에 이르기까지 제품 또는 서비스와 관련된 상품, 데이터 및 재정의 흐름을 관리합니다.
많은 사람들이 공급망을 물류와 동일시하지만 물류는 실제로 공급망의 한 구성 요소에 불과합니다. 오늘날 디지털 기반 SCM 시스템에는 제품 및 서비스 제작, 주문 이행, 정보 추적의 모든 관련 당사자, 즉 공급자, 제조자, 도매업체, 운송 및 물류 공급 업체, 소매업체를 위한 자재 처리와 소프트웨어가 포함됩니다.
공급망 활동은 조달, 제품 수명 주기 관리, 공급망 계획(재고 계획 및 기업 자산 및 생산 라인의 유지 관리 포함), 물류(운송 및 차량 관리 포함), 주문 관리를 모두 포괄합니다. SCM은 글로벌 공급업체 관리 및 다국적 생산 프로세스와 같은 글로벌 무역 관련 활동으로 확장할 수도 있습니다.
 
제조분야

5.ERP(Enterprise Resource Planning)
전사적 자원 관리(ERP)는 재무, 인사 관리, 제조, 공급망, 서비스, 조달 등 비즈니스의 여러 부문에서 자동화와 프로세스를 지원해 운영 효율성을 높이도록 돕는 소프트웨어 시스템입니다.
6.BI(Business Intelligence)
비즈니스 인텔리전스(BI)는 조직이 더 나은 의사결정을 내리고, 정보를 기반으로 행동을 취하고, 보다 효율적인 비즈니스 프로세스를 구현할 수 있게 해주는 역량을 의미합니다.
7.RTE(Real-Time Enterprise)
RTE란 기업 내부 및 외부의 업무를 실시간으로 처리할 수 있도록 하여 기업의 경쟁력을 극대화하는 기업을 의미하는 것으로, 기업 내부의 업무처리뿐만 아니라 실시간으로 외부 파트너사와 고객사를 연계하여 업무를 처리함으로써 경영환경 변화에 민첩하게 대응할 수 있는 체계를 의미합니다.
 
금융부문
8.EAI(Enterprise Application Integration)
엔터프라이즈의 미들웨어를 인프라로 하여 다양한 이질적 기업환경(애플리케이션, 데이터, 플랫폼 및 네트워크 등)을 통합하여 하나의 시스템으로 관리 운영할 수 있는 유기적인 시스템