이케이케 잘하기

전체 글

24년 여름을 지나가며. 2024.08.21
[TRINO/SQL] 매주 목요일 구하기 2024.03.04
[trino/sql] 세션 파라미터 설정하기 2024.03.01
[pandas] DataFrame to_sql 메서드 사용 2024.02.22
[SQL/Trino] 날짜 더하기 2024.01.10
[시계열 데이터] 변환/차분 변환모델 해석 2024.01.03
[prophet] 시계열 라이브러리 Prophet 설치 오류 2024.01.03
[시계열 분석 5-②] HMM과 시계열 분석 2023.11.16

24년 여름을 지나가며.

2024. 8. 21. 19:41

[TRINO/SQL] 매주 목요일 구하기

joonizz 2024. 3. 4. 17:33

2024. 3. 4. 17:33

TRINO DB 에서 매주 목요일 구하기

SELECT date_add('day', -day_of_week(current_date), date_add('day', 4, current_date));

'Data Science > SQL' 카테고리의 다른 글

[trino/sql] 세션 파라미터 설정하기 (0)	2024.03.01
[SQL/Trino] 날짜 더하기 (0)	2024.01.10
[SQL] 단일행 NULL관련 함수 (0)	2023.06.01
[SQL/AWS/Redshift] 변수 @set 사용하기 (0)	2023.05.11
[AWS/Redshift] Redshift 변수 선언하기 (0)	2023.03.08

[trino/sql] 세션 파라미터 설정하기

joonizz 2024. 3. 1. 21:56

2024. 3. 1. 21:56

@set anl_dt = CAST('2024-02-29' AS DATE)

주의 set은 소문자로 써야함

; 붙이면 안됨

SELECT *

FROM TABLE

WHERE anl_dt = ${anl_dt};

'Data Science > SQL' 카테고리의 다른 글

[TRINO/SQL] 매주 목요일 구하기 (0)	2024.03.04
[SQL/Trino] 날짜 더하기 (0)	2024.01.10
[SQL] 단일행 NULL관련 함수 (0)	2023.06.01
[SQL/AWS/Redshift] 변수 @set 사용하기 (0)	2023.05.11
[AWS/Redshift] Redshift 변수 선언하기 (0)	2023.03.08

[pandas] DataFrame to_sql 메서드 사용

joonizz 2024. 2. 22. 11:08

2024. 2. 22. 11:08

pandas에서 DataFrame을 DB로 insert 시키고 싶을때 여러가지 방법이 있다.

원래는 파일형식의 hive DB를 사용하다가 ICEBERG로 옮기게 되었는데, ICEBERG에서는 MinIO로 parquet를 밀어넣는 방식을 사용하지 않는다. 귀찮..

그래서 속도가 좀 느려지지만 to_sql 방식을 사용해서 Pandas DataFrame을 그대로 insert 해보았다.

1. [SQL] ICEBERG DB로 테이블을 생성

CREATE TABLE ICEBERG.schema.table (
	ANL_DT 	VARCHAR(10),
	a		VARCHAR(9),
	b		VARCHAR(18),
	c		VARCHAR(100),
	create_date  	date
)
WITH (
   format = 'parquet',
   location = 's3a://bucket/iceberg/schema/DM_PMI_MDL_OUT'
)
;

2. [Python] DB Connect / engine 만들기

import sqlalchemy

def conn():
    return connect(
        user="...",
        http_scheme="https",
        auth=BasicAuthentication("///", "///"),
        host="...",
        port= ... ,
        catalog= "iceberg",
        schema= "..." 
        )

engine = sqlalchemy.create_engine('trino://', creator=conn)

trino를 사용하였기 때문에 .create_engine url 부분에 trino://를 사용하였다.

3. [Python] to_sql 매서드 적용

df.to_sql('table', con=engine, schema = 'schema',if_exists='append',chunksize = 5000, method = 'multi', index = False)

chunksize를 적절히 설정하고 method를 multi로 설정한다.

1) chuksize : 각 배치때마다 한번에 written 할 row 수, 설정 안할 경우 한번에 하나씩 written됨

2) method

① multi: mutilple하게 insert

② None: 설정 안할령우 한번에 하나씩 insert

+ ) 속도 튜닝은 아직 안해봐서 좀 느린듯 함

'Data Science > python' 카테고리의 다른 글

[Python] Python에서 Warning 무시하기 (0)	2023.02.28
[Python] Pandas isin 구문 (0)	2023.01.31
[Python] 사이킷런 train_test_split 결측 에러 처리 (0)	2023.01.27
[redshift/AWS] ERROR: division by zero 해결 방법 (0)	2022.10.26
[Python/Pandas] 데이터프레임 셀에서 값만 꺼내오고싶을때 (0)	2022.10.20

[SQL/Trino] 날짜 더하기

joonizz 2024. 1. 10. 09:22

2024. 1. 10. 09:22

INTERVAL '1' DAY를 활용하면 날짜 더하기가 가능하다

CAST('2023-07-13' AS DATE) + INTERVAL '1' DAY

'Data Science > SQL' 카테고리의 다른 글

[TRINO/SQL] 매주 목요일 구하기 (0)	2024.03.04
[trino/sql] 세션 파라미터 설정하기 (0)	2024.03.01
[SQL] 단일행 NULL관련 함수 (0)	2023.06.01
[SQL/AWS/Redshift] 변수 @set 사용하기 (0)	2023.05.11
[AWS/Redshift] Redshift 변수 선언하기 (0)	2023.03.08

[시계열 데이터] 변환/차분 변환모델 해석

2024. 1. 3. 16:51

[prophet] 시계열 라이브러리 Prophet 설치 오류

joonizz 2024. 1. 3. 09:39

2024. 1. 3. 09:39

Prophet 설치시 발생한 오류 조치 방법

!pip install prophet

prophet 패키지 install 해주고 패키지를 불러오면

from prophet import Prophet

Importing plotly failed. Interactive plots will not work.

이런 워닝이 발생한다.

해결방법 초간단.

!pip install plotly

plotly 까지 install 해주면 오류 해결

'Data Science' 카테고리의 다른 글

[시계열 데이터] 변환/차분 변환모델 해석 (0)	2024.01.03
[시계열 분석 5-②] HMM과 시계열 분석 (0)	2023.11.16
[시계열 분석 5-①] HMM과 시계열 분석 (0)	2023.11.16
[시계열 분석 4-②] Anomaly Detection 이상치탐지 (0)	2023.11.09
[시계열 분석 4-①] Anomaly Detection 이상치탐지 (0)	2023.11.09

[시계열 분석 5-②] HMM과 시계열 분석

2023. 11. 16. 21:11

PREV 이전 1 2 3 4 5 NEXT 다음

이케이케 잘하기

전체 글

24년 여름을 지나가며.

[TRINO/SQL] 매주 목요일 구하기

'Data Science > SQL' 카테고리의 다른 글

[trino/sql] 세션 파라미터 설정하기

'Data Science > SQL' 카테고리의 다른 글

[pandas] DataFrame to_sql 메서드 사용

'Data Science > python' 카테고리의 다른 글

[SQL/Trino] 날짜 더하기

'Data Science > SQL' 카테고리의 다른 글

[시계열 데이터] 변환/차분 변환모델 해석

[prophet] 시계열 라이브러리 Prophet 설치 오류

'Data Science' 카테고리의 다른 글

[시계열 분석 5-②] HMM과 시계열 분석

+ Recent posts

티스토리툴바