본문 바로가기

정규식으로 원문자 바꾸기 \s[①|②|③|④|⑤] \s : 띄어쓰기 [ ] : 그룹화 | : or 응용 re.sub('[①|②|③|④|⑤]', '-', text) 주문 방법 ① 주문하기를 누른다 ② 포장과 매장 중 원하는 것을 고른다 ③ 메뉴를 고른다 ④ 주문하기 버튼을 누른다 ⑤ 원하는 결제수단을 누른다 변환하면 이렇게 나온다. 주문 방법 - 주문하기를 누른다 - 포장과 매장 중 원하는 것을 고른다 - 메뉴를 고른다 - 주문하기 버튼을 누른다 - 원하는 결제수단을 누른다
Anaconda conda 가상환경 만들기 가상환경 만들기 conda env list가상환경 생성 conda create -n env_name python=3.7가상환경 목록 확인 conda env list가상환경 활성화 conda activate env_name라이브러리 설치 conda install tensorflow==1.13.1가상환경 비활성화 conda deactivate가상환경 추출 conda env export --name env_name > environment.yml가상환경 적용 conda env create -f ./environment.yml가상환경 삭제 conda remove --name env_name --all라이브러리 추출 및 적용 conda list --export > packagelist.txt conda insta..
Python xlsxwriter 라이브러리로 엑셀 xlsx 파일 생성하기 import xlsxwriter workbook = xlsxwriter.Workbook('filename.xlsx') worksheet = workbook.add_worksheet() data_list = [['이름', '학번', '학과'], ['김철수', '20200103165', '경제학과'], ['김영희', '20191354683', '경영학과']] for row, data in enumerate(data_list): for column, token in enumerate(data): worksheet.write_string(row, column, token) workbook.close() worksheet.write_string() : 긴 길이의 url도 에러 없이 출력해주는 함수 실행 결과 참고..
Python으로 csv 파일 생성하고 한글 깨짐 문제 해결 import csv # newline='' 설정이 없는 경우 row와 row 사이에 뉴라인이 한번 더 들어가게 됨 # encoding='utf-8-sig' 설정은 한글 깨짐 방지 f = open('students.csv', 'w', encoding='utf-8-sig', newline='') wr = csv.writer(f) data_list = [['이름', '학번', '학과'], ['김철수', '20200103165', '경제학과'], ['김영희', '20191354683', '경영학과']] # 리스트 형식의 데이터가 있는 경우 루프를 돌려서 입력 가능 for data in data_list: wr.writerow(data) f.close() 실행 결과 참고자료 한글 깨짐 문제 해결 [https://..
numpy.random.choice() 함수 사용하기 numpy.random.choice(a, size=None, replace=True, p=None) a : 1차원 배열 또는 정수 (정수인 경우, np.arange(a) 와 같은 배열 생성) size : 정수 또는 튜플(튜플인 경우, 행렬로 리턴됨. (m, n, k) -> m * n * k), optional replace : 중복 허용 여부, boolean, optional p : 1차원 배열, 각 데이터가 선택될 확률, optional numpy.random.choice(5, 3, True) - 0 이상 5 미만인 정수 중 3개를 출력한다. (중복 허용) numpy.random.choice(5, 3, False) - 0 이상 5 미만인 정수 중 3개를 출력한다. (중복 비허용) 참고자료 https:/..
XML 문서에 Processing Instruction 추가하기 Processing Instruction은 처리 명령으로 XML 문서에 대한 정보를 응용프로그램에 전달하는 역할을 한다. XML 시작 부분에 등장하는 XML 선언이 처리 명령 중 하나인데 이렇게 생겼다. 그런데 나는 XML 선언 말고도 PI를 또 XML 내부에 추가해야됐다. 구글링으로도 자료가 많이 나오지 않아서 파이썬 라이브러리문서와 구글링으로 코드를 짰다. 코드가 돌아가고 XML 문서도 정상적으로 실행이 되어서 기록용으로 올려본다. XML 문서 파싱 방법은 많이 나오는데.. 만드는 법은 찾기 어려웠다. 12345678from lxml import etree NSMAP = {'mml': 'http://www.w3.org/1998/Math/MathML', 'xlink': 'http://www.w3.org..
XML 문서에 주석 달기 1234567from lxml import etree NSMAP = {'mml': 'http://www.w3.org/1998/Math/MathML', 'xlink': 'http://www.w3.org/1999/xlink'}article = etree.Element("article", {'article-type': 'research-article', 'dtd-version': '1.1d3', '{http://www.w3.org/XML/1998/namespace}lang': 'en'}, nsmap=NSMAP)comment = etree.Comment('xml annotation')article.insert(2, comment)Colored by Color Scriptercs xml 문서를 만들다가 주석을 같..
알파벳에서 발음 구별 기호(Diacritic, Accent Mark) 분리하기 데이터를 가공하다가 불어, 이탈리아어 등을 만나면 항상 악센트 마크가 같이 있는데 (예. Ślusàrski) 이걸 제거하고 알파벳 형태로만 가져오는 방법이다. 원래 pytorch RNN 튜토리얼을 공부하다가 알게 된 내용인데 실제로 다른 데이터를 가공하다가 필요해서 정리해본다. 아마 pytorch 튜토리얼을 못 봤으면 구글링만 계속 하고 있었을거다.. 검색하기 너무 어렵다...ㅠㅠ 다음은 pytorch rnn 튜토리얼에서 가져온 알파벳에서 발음 구별 기호 분리하는 메소드에서 변수명만 직관적으로 수정한 것이다. 1234567891011121314151617import unicodedataimport string all_letters = string.ascii_letters + " .,;'"n_letters..