목상치
728x90

'무료강의'에 해당되는 글 3건

  1. 2023.01.08 패캠 레벨원 이벤트 - 강의 기간내 50% 이상 들으면 내 것
  2. 2023.01.07 딥러닝레벨원07 : 딥러닝 이론
  3. 2022.07.03 이것이 진짜 크롤링이다 - 기본편
목하치
반응형
728x90

패스트캠퍼스에서 진행하는 무료 강의 이벤트 

내용도 나쁘지 않고 기간내 50% 수강하면 내 강의가 된다. 80% 이상 들여면 수강할인권도 주는 이벤트

강의수는 6개 이지만 딥러닝 들어보니 너무 쉽게 이해가 되고 입문이 되어 기본 과정에도 들어보고 싶은 생각이 들정도로

 

 

 

728x90

'FastCampus' 카테고리의 다른 글

Core MBA  (0) 2023.01.14
Core MBA 01  (0) 2023.01.14
일잘러를 위한 비즈니스 스피치  (0) 2022.12.01
Posted by 댕기사랑
,
728x90

이전강의 : 딥러닝레벨원06 : 딥러닝환경세팅&GPCPU

04뇌는 지방단백질덩어리이지만 신경망이 있는 특별한 것이며 신경세포가 뭉쳐 있다.  세포체, 축삭, 미엘린수초, 슈반세포, 수상돌기, 축삭말단등으로 구성됨//액션 퍼텐셜을 이용하여 입력을 받아 더하고 입력을 받아 함수로 출력

퍼셉트론 : (딥러닝-가중치 학습)  백프로게이션(복잡한미분) 

딥러닝 + 빅데이터(학습 및 가중치 수정), 배치팩터 삭제, 사견 제거, 로스 함수, 경사하강법, 최적화도구, 러닝레이터(Learning Rate), Dropout

분류법
이산/연속(한개 씩 셀수 있나?) - 이산수학- 확률과 통계(가능성을 연구하면서 발달된 학문) - 빈도(주사위가 전체 대비 6이 나온 확률은?/강수확률) - 신뢰도(정보의 믿음 척도[포마스 메이지]) - (뇌는 베이즈정리계산기) -
소프트맥스(softmax/단순한 숫자의 나열을 확률 차원으로 변화)- 다른 선택지보다 높은 수치로 봐야 함.- (이산 데이터에서 카테고리 구분 행위이고 베이지 함수로 진행한다.)
데이터는 피처(학습지)와 레이블(정답지)  구성되며 원핫벡터(레이블과 )로 하고 데이터는 노말라이징해야 하며  (8:2트레이닝테스트), 

연속적 변량은 회귀를 기반으로 하며 추세외삽법(지금까지 과거 데이터로 현재/미래를 예측하는 법), 내삽(지금까지 데이터중 내부 기간 데이터를 뽑는 것) 예측하는 데이터 이산적이면 어떤 카테고리인지 구분한다면 연속적은 구체적인 소수를 추론함, 시그모이드 함수(출력층의 값을 0(최소값)과 1(최대값)사이로 나오게 제약으로 -AI가 특정 범위에 출력값을 그룹핑/제한적 하게 해주는 함수) , 로스함수는 크로스 로스 대신 ME(평균에러), MAE(평균절대값에러), MAPE(절대값+퍼센트), MSQ(제곱값) [46.7% 5:32] 

영상인식 - 빛의 삼원색에 의해 RGB로 구성된 픽셀이며 이 픽셀(점)이 모여서 영상을 이미지를 만드는 것으로 AI는 이미지의 픽셀정보를 넣어 보며 AI는 3차원정보로 처리해야 함 . 플랙팅레이어(Flattening )를 이용하며   [48.3% 5:43 -50% 5:52 //평생수강획득 ]조심 80%되면 할인권이 나오는 데 7일 유효기간만 해 ]

06.인간의 시각인식 - 원추세포 3개(색), 간상세포 1개(명암),  [50%, 6:05]
양쪽 눈은 크로스 하셔 좌우뇌로 정보 전달 (안구/시시경/외측슬상핵/시각피질/아래관자피질&두정엽
v1(경계면)>v2(면-착시현상)>v4(객체인식Attention)>it(얼굴)  (7:43) What(V1->V4)&Where(V1 -> v6) 
시신경 흉내> 정보처리 단계 흉내> 신경망(V4출력값 IT취합) 흉내

CNN-컨볼루션- 이미지 원본 이미지를 줄임(추상화성공) <--> zero padding  pooling layer (이미지를 더 빠른 속도로 작아지게 만들때)
퍼셉트론-입력&가중치>각 입력과 가중치를 곱해서 더함>활성화함수를 씌워 출력값>학습통해 가중치 수정
FNN-
성능개선-배치노말레이제이션
DCN-CNN반대

07시각처리는 CNN이 우수한 AI를 보았어요 그외 뇌를 배워서 강화하고 있어요. 특히 도파민 원리를 이용한다면 최고가 될수 있을 듯 

08CNN을 쌓으면 인간의 뇌와 비슷해져요 화가의 화풍을 따라하는 AI로 pip install --upgrade tensorflow_hub를 실행하여 준비함.

 

08

 

다음강의: 딥러닝레벨원08 : 실행

728x90
Posted by 댕기사랑
,
728x90

며칠 째 웹페이지에서 데이터 보고 긁어 복붙하는 작업이 퇴근을 붙잡아서 방법이 없나 고민하던중

일차로 떠 오른 것은  DB접속하여  쿼리  하는 방법이였으나 시스템 구조상 위험하여 xx 거부 되었고 대안으로 (대상 시스템이 API를 제공하므로) API쿼리가 가능하다고 했으나 파이썬 프로그램을 좀 해야하는 지루함이 보여서 무식하지만 웹 방식도 알아야 자동화도 가능하므로 크롤링 수업을 듣기로 했다. 

여러 크롤링 강의가 있지만 스타트코딩 이 제일 먼저 들어왔다. 구성은 2편이지만 우선 기본 편을 마스터 해보고 실전 강의는 

구분 강의수 시간 주요내용 가격
기본 19강 154분 강의소개/환경설정/준비운동/실전사례 2개/종료 무료
실전       77,000원
         
         

 

기본편

강의소개, 환경설정, 준비운동, 실전사례 #1, #2, 종료3

 

강의소개

첫 챕터 강의 소개는 크롤링에 대해 좋은 점, 강의 효과를 다루었고 프로그래밍에 대한 마음가짐에 대해 소개했다.  주의사항이 있는데 "상업적"으로 이용하지 않아야 하며  대상서버에 "부담"되지 않도록

 

환경설정

환경설정에선 파이썬 설치를 한다. 파이썬은 버전 3.9이며 문법이 쉽고 간단한 언어이고 자료도 많고 다양한 분야 (데이터, 웹분석 등등) 에서 활용가능한 언어이다. 하지만 난 이미 3.10을 설치해 놓아서 다운그레이드 없이 바로 실행하고 예제인 프린트를 해보았다. 그런데 파이썬 사이트에서 보니 최신 버전이 아니여서 업그레이드 (파이썬 업그레이드 하러) 도 하고. 그리고 ( 이미 노트패드++가 있지만 ..)  VS Code를 다운 받아 실행했다. (다운로드 링크 - 바로 최신 버전으로 된다.)



이미지 클릭 다운로드로 이동

설치된 VS 코드에 한국어 적용한 버전

설치후 프로젝트 설정 (신뢰 선택) 하고 창 크기/폰트크기 재설정한다.ㅡ compact폴더 해지, 파이썬 확장프로그램 설치

 

준비운동(4) - Tag, html, bs4, css

HTML 기본 요소 는 TAG <> 이고 속성명과 속성값 , 구조는 부모 자식 순으로 한다.  주요 태그는 A, ul,lu, 등등

Request :  http/https 에 요청하는 것, 주로 POST로 

Request 설치 한다.  오류나면 여기 참조  이후 네이버를 불러와 보여준다.

import requests

response = requests.get("https://www.naver.com")
html = response.text
print(html)

#첫 실수 : reponse로 받는 데 requeset로 받아서 오류남

태그 받아 오기 위해  아래 처럼 작성하고 실행하면 해당 ID에 딸린 텍스트를 가져온다.

import requests

from bs4 import BeautifulSoup


#네이버 접속
response = requests.get("https://www.naver.com")

#html 받아옴
html = response.text


soup = BeautifulSoup(html,'html.parser')

# ID 찾기
word = soup.select_one('#NM_set_home_btn')

print(word.text)

여전히 에러나는데  ModuleNotFoundError: No module named 'bs4' 찾아보니 설치가 안되어서 그런거라 모듈 설치

css 선택자는 디자인을 변경할 html태그를 선택하는 것 , 
종류는 태스선택, id선택자(#~), class 값 (.~), 자식선택자( > )

실전 프로젝트 1) 뉴스 데이터 수집하기


뉴스 제목과 링크 가져오기

우선 원하는 정보가 있는 페이지에 가서 정보를 찾고 선택자가 뭐가 있는지 확인해본다. 예제는 a 태그 및에 타이틀과 링크가 있고 news_tit를 인지하고 중복 값이 있는 지 제대로 나오는 지 검증(검색 ,^F) 해본다. 
이후 지난 시간 배운 url 을 쳐서 값을 저장하고  그중 특정 태그가 있는 지 찾고 관련 하위 정보를 검색하여 변수에 저장.
저장할 때 데이터 특성상 표로 되어야 하므로 for문을 이용하여 저장

import requests
from bs4 import BeautifulSoup

response1 = requests.get("https://search.naver.com/search.naver?where=news&sm=tab_jum&query=%EC%82%BC%EC%84%B1%EC%A0%84%EC%9E%90")

html = response1.text

soup1 = BeautifulSoup(html,'html.parser')
resultg1 = soup1.select(".news_tit")  #결과는 리스트문
for results1 in resultg1:
 title = results1.text
 url = results1.attrs['href']
 print("정렬된 값 --------------------------")
 print(title, url)

print("최초 값 -----------------")
print (resultg1)

이제 검색값을 받아서 결과 조회하기인데 input 함수를 사용하고 기존 링크에 +  걸면된다.


kw1 = input("검색어 입력하세요")

텍스트 검색창 대신 이쁜 창 은 pyautogui 로 해결하면 된다.  설치는 pip install pyautogui 로 하면 되며

import pyautogui

 
#kw1 = input("검색어 입력하세요")
kw1 = pyautogui.prompt("검색어 입력하세요")

이제 검색결과의 2페이지 이후 내용을 검색해보자. 페이지 링크 를 보니 규칙을 찾고 그 것을 반복 시키면 된다. 규칙은 start=?? 이고 반복은 for i in range(시작, 끝, 증가): 를 이용하면 된다.

import requests
import pyautogui

from bs4 import BeautifulSoup
# &sort=0&photo=0&field=0&pd=0&ds=&de=&cluster_rank=85&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:r,p:all,a:all&start=1
# &sort=0&photo=0&field=0&pd=0&ds=&de=&cluster_rank=31&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:r,p:all,a:all&start=11
# &sort=0&photo=0&field=0&pd=0&ds=&de=&cluster_rank=47&mynews=0&office_type=0&office_section_code=0&news_office_checked=&nso=so:r,p:all,a:all&start=21
#kw1 = input("검색어 입력하세요")
kw1 = pyautogui.prompt("검색어 입력하세요")

for i in range (1, 30, 10):
  response1 = requests.get(f"https://search.naver.com/search.naver?where=news&sm=tab_jum&query={kw1}&start={i}")
  html = response1.text
  soup1 = BeautifulSoup(html,'html.parser')
  resultg1 = soup1.select(".news_tit")  #결과는 리스트문
  for results1 in resultg1:
    title = results1.text
    url = results1.attrs['href']
    print(f"정렬된 값 --{i}--------------------------")
    print(title, url)


  print("최초 값 -----------------")
  #print (resultg1)

#실수 for 문 사이 빈줄을 넣어주면 안된다. 파이썬은 구문들어쓰기에 민감한 것 같다.

이제 사용자에게 최종 페이지를 입력받아 범위를 정한다.  변수 선언하고 끝값에 넣어주면 되는데 받는 값은 문자열이므로 계산전 형변화 해야 한다.

kw2 = pyautogui.prompt("마지막페이지를 입력하세요")
print(kw2)

for i in range (1, int(kw2)*10, 10):

#실수 형변환 할때 변수만 형변환한다.  int(kw2 * 10 ) 하면 얼마일까?  --> 2222222222

3

3

4

5

6

8




7

728x90
Posted by 댕기사랑
,