본문 바로가기

IT/빅데이타

(6)
Market Intelligence: E-Commerce 21세기의 디지털 시대에서는 데이터가 기업 경쟁력의 핵심 요소로 부상하고 있습니다. 특히 전자 상거래 업계에서는 빠르게 변화하는 시장 환경에서 경쟁우위를 점하기 위해 시장 인텔리전스에 대한 필요성이 더욱 커지고 있습니다. 이는 시장의 동향과 소비자 행태, 그리고 경쟁사의 전략을 이해하고, 이를 바탕으로 전략을 개선하고 의사 결정을 내릴 수 있는 능력을 의미합니다. 시장 인텔리전스의 중요성 시장 인텔리전스는 정보 수집, 분석, 해석을 통해 기업이 시장의 트렌드를 파악하고 경쟁사와 소비자의 행동을 이해하는 프로세스입니다. 아래는 시장 인텔리전스의 핵심 요소에 대한 상세한 설명입니다. 1. 데이터 수집: 웹 스크래핑: 다양한 온라인 플랫폼에서 구조화된 데이터를 수집하는 기술. 이는 전자 상거래 사이트, 소셜 ..
데이터 구조 변경에 따른 예외값 설정 for item in data: selling_info_vo = item.get('sellingInfoVo', None) selling_info = selling_info_vo.get('sellingInfo', {}) if selling_info_vo is not None else {} for 문에서 selling_info_vo 키가 없을 경우가 있다. 최초 데이터 구조는 같지만 예외인 경우가 발생할 경우를 대비해서 코드를 한줄 더 추가해주었다. None 이 아닐때 sellinginfo 키에 해당하는 값을 가져오고 None 일때는 빈 딕셔너리가 sellinginfo 변수에 할당되게 수정. 뭔가 코드상에 예외값이 발견되어 코드가 추가됬다는 것을 알 수 있다. for item in data: selling_..
[Schema] 개념 및 특징 스키마(Schema)란? 스키마는 DB의 구조와 제약 조건에 관한 전반적인 명세를 정의한 메타데이터의 집합입니다. 메타데이터(meta data) : 데이터에 대한 데이터로, 어떤 목적을 가지고 만들어진 데이터로 정의됨. 자세히 말하면, 개체의 특성을 나타내는 속성(Attribute)과, 속성들의 집합으로 이루어진 개체(Entity), 개체 사이에 존재하는 관계(Relation)에 대한 정의와 이들이 유지해야 할 제약 조건을 기술한 것입니다. 데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 기술한 메타데이터의 집합. 메타데이터 데이터를 위한 데이터. 다른 데이터를 설명해 주는 데이터. 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여..
[BigQuery] memo (1) 1.수집 (extract/capture,ingest) 2.변환/처리(tranform, process) 3.저장 (load, store) (ETL,ELT) *CDC(change Data Capture): 데이터 실시간 복 4. 분석(analyze) 5.활용(explore) -ML, 시각화 BigQuery / Dataproc(Managed Spark/Hadoop) Realtime streaming Analytics ( Pub/Sub, Dataflow, Bigquery) Horizontally Scalable SQL (Spanner) QUERY = 기본 디폴트 PIPELINE = ELT 추가 작업 ML_EXTERNAL = 행렬 인수분해 모델
테이블(Table), 필드(Field), 열(Column), 행(Row) Table : 테이블, 빠른 참조를 위해 적당한 형태로 자료를 모아 놓은 것. 관계 데이터 베이스 모델(relational data base model)에서 자료의 구조를 2차원의 표로 나타낸 것. 즉, 행과 열의 형태로 관리되며 키를 지정함으로써 원하는 자료를 빠르고 쉽게 찾아 낼 수도 있다. Field : 필드, 항목, 어떠한 의미를 지니는 정보의 한 조각으로, 데이터베이스 시스템에서 처리의 최소 단위가 되는 것. Column(열) : 관계형데이터베이스 테이블에서 특정한 단순 자료형의 일련의 데이터값과 테이블에서의 각 열을 말한다. 컬럼은 열이 어떻게 구성되어야 할 지에 대한 구조를 제공한다. 관계형 데이터베이스 용어에서 컬럼과 같은 의미로 사용되는 것은 속성(attribute)이다. 필드(field..
데이터 마케팅 업무 프로세스 분석 설계 단계 문제파악 가설세우기/ 목표설정 Desk search (사전조사) 분석프레임 설계 데이터 수집 단계 데이터 수집(크롤링) 분석 데이터 추출/ 정리 데이터 분석 및 인사이트 도출 단계 데이터 분석 인사이트 및 솔루션 도출 1차 분석결과 논의/협의 N차 분석결과 논의/협의 최종 분석내용 발표 이후 실행 Identifiable 사람을 따라다니는 데이터 - 성별,나이, 관심사 등 해당 정보가 사람과 연결돼 있어 대상을 인식할 수 있는 데이터. 이러한 데이터들은 주로 특성 소비자/소비자군을 대상으로 하는 서비스 ex)광고마켓팅,고객맞춤서비스 미디어 또는 플랫폼 사업자를 중심으로 데이터 축적 Unidentifible 사람을 인식할 수 없지만 마케팅에 있어 유의미한 모든 데이터 ex) 키워드, 검색어,..