목상치
728x90

'전체 글'에 해당되는 글 121건

  1. 2022.08.26 한번에 끝내는 구글 스프레드시트 초격차 패키지 온라인
  2. 2022.07.03 이것이 진짜 크롤링이다 - 기본편
  3. 2022.03.26 UIpath
목하치
반응형
728x90

5:25(5:08)

강의명 : 한번에 끝내는 구글 스프레드시트 초격차 패키지 온라인 일반링크 GFC링크 총42:19:28 49개 주제 203개 강의
본 글은 패스트캠퍼스 한 번에 끝내는 구글 스프레드시트 초격차 패키지 온라인의 강좌를 나름 정리한 글로 대부분의 내용은 강의안에서 추출하거나 요약한 것입니다. 

 

PART 1 - 강의에 들어가기 앞서
파트1은 인트로 영역으로 왜 구글 (스프레드)시트인지 어디까지 사용하였는지 강사의 경험이 나와 있다.

 

P1Ch1 강사의 하고픈 말이 나오며 -- - - - -------------------------------------------------------------------------------

P1Ch02_01 왜 구글 시트
ㅇㅅ과 </br>달리 무료이고 온라인이고 협업까지 가능하므로 

 

P1Ch02_02
보통 다수의 대량 메일 발송했던 적이 있는데 강사는 데이터를 모으고 이를 카톡으로 날리고 상당히 많은 영역으로 활용하시는 것 같다. 강의에 나온 사례는 할일목록관리(할일/조회/설정), 나만의 플랫폼(각종 시트연결, 연락처, 검색하기), 연차관리, 업무협업, 재고관리가 있으며 공유 템플릿으로 공유를..

강사 제공 템플릿- 할일목록(Ch02_02)
강사 제공 템플릿- 나만의 플랫폼(Ch02_02)
강사 제공 템플릿-연차관리 (Ch02_02)
강사 제공 템플릿 - 업무 협업 (Ch02_02)
강사 제공 템플릿-재고관리 (Ch02_02)

 

P1Ch02_03 구글시트 세팅
구글 스프레드시트에 접속하는 법 메뉴 편집법 - 드래그앤드랍?, 바로가기 추가, 바탕화면 아이콘 추가

강사 추천 세팅 - 메뉴편집, 바로가기, 아이콘 Ch02_03

 

Ch02_04 모바일에서 구글시트하기
구글시트를 모바일과 PC에서 연동되는 것을 보여주며 모바일 디바이스 특성상 간단한 값을 입력/수정할 때 사용하며 수식등은 PC에서

모바일과 PC에서 연동되는 ..

 

6:23

PART 2 - 구글 시트 기본기 다지기
파트2는  구글 시트 기본 사항을 다루며 용어나 지식의 베이스 기준을 맞출 수 있다.

P2Ch1 구글시트 다루기 위한 기본 개념  -- - - - ----------------------------------------------------------------------------

P2Ch01_01 구글시트 파일 만들기 및 기존 파일 업로드 
구글 시트는 바로 새로 만들기 하면 간단한 일 이며 기존 템플릿을 가져와도 됨

그외 기존 엑셀 파일도 가져오기 가능 - "파일선택기 열기"를 이용하여 가져와도 되고 단, VBA나 복잡한 수식은 호환이 안될 수 있음

 

 

P2Ch01_02 용어정리 - 셀, 행과 열 row column sheet
셀은 한 칸으로 데이터를 입력하는 기본 단위, 행은 한 줄이며 row라 불리며, 열은 횡으로 된 칸으로 Column으로 불리며 ,  시트는 하위 페이지임

 

P2Ch01_03 시트 추가, 삭제 이름 변경 색상변경, 보호기능
구글 시트는 하위 페이지이며 + 눌러 추가하고 해당 시트를 선택 삭제하며 이름 변경하거나 색상 변경하거나 보호기능 설정 가능

댓글보기 기능으로  협업할 수 있으며  메뉴에서 댓글 보기를 누르면 전체가 보인다는 사실

 

6:51/5.4%/1:06

P2Ch2 구글 시트 사용을 위한 기본 설명  -- - - - ---------------------------------------------------------------------------

P2Ch02_01 도구모음 기능 설명

엑셀과 비슷하며 언두, 재실행, 인쇄, 서식복사하기, 화면보기(줌), 서식, 폰트, 글자크기, 등등 여기서 중요한 것은 메뉴 수정이 되니?
인쇄할 때 주의점- 인쇄범위와 용지 크기 잘 설정하고  페이지 방향, 비율등을 조절하여 페이지가 넘어가는 것을 방지함, 여백등을 조절 특히 맞춤 설정으로 세밀하게 조정 가능해~유~ (44분짜리 강의 윽.인쇄 설정에 엄청난 기능이 있네요. 강사님말로는 인쇄를 잘 해야 보고가 잘되니 

붙여넣기도 엑셀과 비슷하게 여러 기능이 있다. 값만, 서식만, 수식만 , 조건부 서식만, 등
등퍼센트 입력시 주의점 1.0 이 100%이므로 퍼센트 변환시 소수점이 되어야 한다. - 전 그래서 바로 입력합니다. 5% 씩으로
격자선을 보기에서 해지하면 격자선이 안보여요 그외 테두리 도구로 음영등
링크삽입으로 외부 페이지 연동 및 내부 시트도 연동 가능합니다.
챠트만들기로 데이터의 챠트 삽입 가능하며 데이터계열과 축 추가로 간단히 표 삽입 가능
필터로 해당 줄만 선택하면 되네 그리고 엄청난 수식이 나오네요. 

 

7:22/5.9%/1:33

7:46

P2Ch02_02 공동작업(공유 기능)
여러 명이 공동작업이 가능해서 잘 배분하면 문서가 금방 만들어진다. (MS 보다 휠씬 빠르고 직관적인것 같다)파일 버전이 다르지 않고 온라인이라 분실 우려도 없고 공유 옵션은 편집,뷰어,댓글 기능과 링크로 공유하는 것도 가능

7:53/6.4%/1:39

7:58

PART 3 - 효율적인 업무를 위해 함수 활용하기
파트3는 함수에 대해 다루는 것 같다.

P3Ch1 함수 수식  -- - - - ----------------------------------------------------------------------------

P3Ch01_01 함수란 
함수는 명령어로 구글 시트의 핵심이라 생각된다. 어떤 특정한 일을 하는 명령어로 반복작업 가능함.

8:01

P3Ch01_02 함수 사용법 설명
함수는 =를 넣어 사용, (텍스트와 구분하기 위해), 인수는 입력값, 

8:06/7.3%/1:47

P3Ch2 사칙연산 -- - - - ----------------------------------------------------------------------------

P3Ch02_0
구글 법

P3Ch02_02
구글 법

P3Ch02_0
구글 법

 

P3Ch3 함수 수식  -- - - - ----------------------------------------------------------------------------

P3Ch03_0
구글 법

 

P3Ch03_0
구글 법

 

6:23

PART 4 - 복사먼저
파트4는 인트로 영.

P4Ch1 구 -- - - - ----------------------------------------------------------------------------

P4Ch01_01 구글시트 
구글 시트

 

 

P4Ch01_02
구글 법

 

P4Ch01_0
구글 법

 

P4Ch01_0
구글 법

 

728x90
Posted by 댕기사랑
,
728x90

며칠 째 웹페이지에서 데이터 보고 긁어 복붙하는 작업이 퇴근을 붙잡아서 방법이 없나 고민하던중

일차로 떠 오른 것은  DB접속하여  쿼리  하는 방법이였으나 시스템 구조상 위험하여 xx 거부 되었고 대안으로 (대상 시스템이 API를 제공하므로) API쿼리가 가능하다고 했으나 파이썬 프로그램을 좀 해야하는 지루함이 보여서 무식하지만 웹 방식도 알아야 자동화도 가능하므로 크롤링 수업을 듣기로 했다. 

여러 크롤링 강의가 있지만 스타트코딩 이 제일 먼저 들어왔다. 구성은 2편이지만 우선 기본 편을 마스터 해보고 실전 강의는 

구분 강의수 시간 주요내용 가격
기본 19강 154분 강의소개/환경설정/준비운동/실전사례 2개/종료 무료
실전       77,000원
         
         

 

기본편

강의소개, 환경설정, 준비운동, 실전사례 #1, #2, 종료3

 

강의소개

첫 챕터 강의 소개는 크롤링에 대해 좋은 점, 강의 효과를 다루었고 프로그래밍에 대한 마음가짐에 대해 소개했다.  주의사항이 있는데 "상업적"으로 이용하지 않아야 하며  대상서버에 "부담"되지 않도록

 

환경설정

환경설정에선 파이썬 설치를 한다. 파이썬은 버전 3.9이며 문법이 쉽고 간단한 언어이고 자료도 많고 다양한 분야 (데이터, 웹분석 등등) 에서 활용가능한 언어이다. 하지만 난 이미 3.10을 설치해 놓아서 다운그레이드 없이 바로 실행하고 예제인 프린트를 해보았다. 그런데 파이썬 사이트에서 보니 최신 버전이 아니여서 업그레이드 (파이썬 업그레이드 하러) 도 하고. 그리고 ( 이미 노트패드++가 있지만 ..)  VS Code를 다운 받아 실행했다. (다운로드 링크 - 바로 최신 버전으로 된다.)



이미지 클릭 다운로드로 이동

설치된 VS 코드에 한국어 적용한 버전

설치후 프로젝트 설정 (신뢰 선택) 하고 창 크기/폰트크기 재설정한다.ㅡ compact폴더 해지, 파이썬 확장프로그램 설치

 

준비운동(4) - Tag, html, bs4, css

HTML 기본 요소 는 TAG <> 이고 속성명과 속성값 , 구조는 부모 자식 순으로 한다.  주요 태그는 A, ul,lu, 등등

Request :  http/https 에 요청하는 것, 주로 POST로 

Request 설치 한다.  오류나면 여기 참조  이후 네이버를 불러와 보여준다.

import requests

response = requests.get("https://www.naver.com")
html = response.text
print(html)

#첫 실수 : reponse로 받는 데 requeset로 받아서 오류남

태그 받아 오기 위해  아래 처럼 작성하고 실행하면 해당 ID에 딸린 텍스트를 가져온다.

import requests

from bs4 import BeautifulSoup


#네이버 접속
response = requests.get("https://www.naver.com")

#html 받아옴
html = response.text


soup = BeautifulSoup(html,'html.parser')

# ID 찾기
word = soup.select_one('#NM_set_home_btn')

print(word.text)

여전히 에러나는데  ModuleNotFoundError: No module named 'bs4' 찾아보니 설치가 안되어서 그런거라 모듈 설치

css 선택자는 디자인을 변경할 html태그를 선택하는 것 , 
종류는 태스선택, id선택자(#~), class 값 (.~), 자식선택자( > )

실전 프로젝트 1) 뉴스 데이터 수집하기


뉴스 제목과 링크 가져오기

우선 원하는 정보가 있는 페이지에 가서 정보를 찾고 선택자가 뭐가 있는지 확인해본다. 예제는 a 태그 및에 타이틀과 링크가 있고 news_tit를 인지하고 중복 값이 있는 지 제대로 나오는 지 검증(검색 ,^F) 해본다. 
이후 지난 시간 배운 url 을 쳐서 값을 저장하고  그중 특정 태그가 있는 지 찾고 관련 하위 정보를 검색하여 변수에 저장.
저장할 때 데이터 특성상 표로 되어야 하므로 for문을 이용하여 저장

import requests
from bs4 import BeautifulSoup

response1 = requests.get("https://search.naver.com/search.naver?where=news&sm=tab_jum&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90")

html = response1.text

soup1 = BeautifulSoup(html,'html.parser')
resultg1 = soup1.select(".news_tit")  #결과는 리스트문
for results1 in resultg1:
 title = results1.text
 url = results1.attrs['href']
 print("정렬된 값 --------------------------")
 print(title, url)

print("최초 값 -----------------")
print (resultg1)

이제 검색값을 받아서 결과 조회하기인데 input 함수를 사용하고 기존 링크에 +  걸면된다.


kw1 = input("검색어 입력하세요")

텍스트 검색창 대신 이쁜 창 은 pyautogui 로 해결하면 된다.  설치는 pip install pyautogui 로 하면 되며

import pyautogui

 
#kw1 = input("검색어 입력하세요")
kw1 = pyautogui.prompt("검색어 입력하세요")

이제 검색결과의 2페이지 이후 내용을 검색해보자. 페이지 링크 를 보니 규칙을 찾고 그 것을 반복 시키면 된다. 규칙은 start=?? 이고 반복은 for i in range(시작, 끝, 증가): 를 이용하면 된다.

import requests
import pyautogui

from bs4 import BeautifulSoup
# &sort=0&photo=0&field=0&pd=0&ds=&de=&cluster_rank=85&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:r,p:all,a:all&start=1
# &sort=0&photo=0&field=0&pd=0&ds=&de=&cluster_rank=31&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:r,p:all,a:all&start=11
# &sort=0&photo=0&field=0&pd=0&ds=&de=&cluster_rank=47&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:r,p:all,a:all&start=21
#kw1 = input("검색어 입력하세요")
kw1 = pyautogui.prompt("검색어 입력하세요")

for i in range (1, 30, 10):
  response1 = requests.get(f"https://search.naver.com/search.naver?where=news&sm=tab_jum&query={kw1}&start={i}")
  html = response1.text
  soup1 = BeautifulSoup(html,'html.parser')
  resultg1 = soup1.select(".news_tit")  #결과는 리스트문
  for results1 in resultg1:
    title = results1.text
    url = results1.attrs['href']
    print(f"정렬된 값 --{i}--------------------------")
    print(title, url)


  print("최초 값 -----------------")
  #print (resultg1)

#실수 for 문 사이 빈줄을 넣어주면 안된다. 파이썬은 구문들어쓰기에 민감한 것 같다.

이제 사용자에게 최종 페이지를 입력받아 범위를 정한다.  변수 선언하고 끝값에 넣어주면 되는데 받는 값은 문자열이므로 계산전 형변화 해야 한다.

kw2 = pyautogui.prompt("마지막페이지를 입력하세요")
print(kw2)

for i in range (1, int(kw2)*10, 10):

#실수 형변환 할때 변수만 형변환한다.  int(kw2 * 10 ) 하면 얼마일까?  --> 2222222222

3

3

4

5

6

8




7

728x90
Posted by 댕기사랑
,

UIpath

2022. 3. 26. 17:23

보호되어 있는 글입니다.
내용을 보시려면 비밀번호를 입력하세요.