본문 바로가기

IT/Python

(37)
[Python] Dictionary 자료형 딕셔너리의 응용 예시를 보면서 딕셔너리의 정의와 특징에 대해 알아보겠습니다. 1. 딕셔너리의 정의와 특징 “컬렉션”이란? 여러개의 값을 하나의 변수에 담을 수 있음 변수 안에 공간을 여러개 가짐 변수 안에 서로 다른 공간을 찾는 방법이 있음 “컬렉션”이 아닌 것은? 대부분의 변수는 한 값만을 가짐 변수에 새값을 대입하면 이전값이 덮어씌어짐 x =2 x =4 print(x) 컬렉션의 종류 리스트 : 순서를 유지하는 값들의 선형 컬렉션 프링글스 같음 딕셔너리 : 고유의 라벨을 갖고 있는 값을 넣은 가방 순서라는 것이 없음 마치 라벨을 붙이는 것과 같음 지갑과 캐리어와 같음 안에 던져 넣고 이거줘이거줘 ! 소리치는 것 딕셔너리 파이썬의 가장 강력한 데이터 컬렉션 파이썬에서 빠르게 데이터베이스 같은 연산을 가능..
[Python] 날짜타입 문자열로 변경하기 - Datetime to String Datetype을 문자열로 바꾸는 방법에 대해 알아보도록 하겠습니다. Data : Datetime.datetime(2022,5,30, 17,2,48, 1900228) Result : 2022-05-30 import datetime now = datetime.datetime.now() now.strftime('%Y-%m-%d') # '2022-05-10' now.strftime('%Y/%m/%d') # '2022/05/10' now.strftime('%Y-%m-%d %H:%M:%S")
[Python] 문자열 자르기 python substring 파이썬에서는 문자열을 자를때 기본적으로 배열을 사용합니다 . Data : date = '2022-05-10 12:33:44' Result : '2022-05-10' Python Code date = '2022-05-10 12:34:33' print(date[:10]) print(date[0:10])
[Python] python 코드 실행 일시정지 - sleep() Python sleep 함수 활용 Time.Sleep(초) 단위로 활용하시면 됩니다. ms 단위로 사용하실 경우에는 실수를 사용하시면 됩니다. import time time.sleep(1) time.sleep(0.1)
[Python] List, Dictionary, Tuple Sum 계산 How : SUM() Data : List = [ 1, 2, 3, 4, 5 ] Or Tuple = ( 1, 2, 3, 4, 5 ) Or Dictonary = { ‘a’: 1, ‘b’:2 , ‘c’:3} Result : List - > 15 Tuple -> 15 Dictionary -> 6 리스트 안에 요소들의 합을 계산하는 법을 소개하겠습니다. 1) List 일 경우 List = [ 1, 2, 3, 4, 5 ] Sum_list = sum(list) print(Sum_list) 2) Tuple 일 경우 Tuple = ( 1, 2, 3, 4, 5 ) sum_tuple = sum(Tuple) print(sum_tuple) 3) Dictionary 일 경우 Dict = { ‘a’: 1, ‘b’:2 , ‘c’:3..
[Python] 두개의 리스트 하나로 합치기 Data : A = [1, 2, 3] B = [4, 5, 6] Result [1, 2, 3, 4, 5, 6] 두개의 리스트를 하나로 합치는 방법에 대해 알아보겠습니다. 1. + 연산자 이용 2. extend () 이용 List1 = [1, 2, 3] List2 = [4, 5, 6] List 3 = List1 + List2 print(List3) 2. Extend() 이용 List1 = [1, 2, 3] List2 = [4, 5, 6] List1.extend(List2) print(List1)
pySpark sql 활용하여 계층데이터 처리하기 CTE from pyspark.sql.functions import broadcast df = sqlContext.createDataFrame([(1, 2), (2, 3), (3, 4), (4, 5), (6, 7), (7, 8),(9, 10)], "OldID integer,NewID integer") dfcheck = df.drop('NewID') dfdistinctID = df.select('NewID').distinct() dfidfinal = dfdistinctID.join(dfcheck, [dfcheck.OldID == dfdistinctID.NewID], how="left_anti") #We find the IDs that have not been replaced # 마지막에 해당하는 정보 찾기 dfc..
How to drop NaN Using Group by On Python Pandas Dataframe? How to Drop NaN elements in a groupby on a pandas Dataframe? Sample Data y x AVERAGE MIN MAX 0 22 13 1 NaN NaN 1 22 13 NaN 2 NaN 2 22 13 NaN NaN 3 Result Data x y AVERAGE MIN MAX 0 13 22 1 2 3 How to do? Method 1. import pandas as pd import numpy as np df_list = [ {'y': '22', 'x': '13', 'AVERAGE': ' 1'}, {'y': '22', 'x': '13', 'MIN': ' 2'}, {'y': '22', 'x': '13', 'MAX': '3'}] df = pd.DataFrame(d..