파이썬 웹크롤링 후 엑셀 저장(멀티프로세싱 구현)

글쓴이2020.05.15 21:19조회 수 511댓글 2

    • 글자 크기

파이썬에서 웹크롤링 후 엑셀 저장하는 코드를 만들었는데

 

데이터가 수만건이라 속도가 너무 느려서 멀티프로세싱을 구현했는데

 

엑셀파일은 한개다 보니 각 프로세스가 침해해서 ? 저장을 하면서

 

데이터가 엉망인데 이런 건 어떻게 해결할 수 있을까요 ㅠ

    • 글자 크기

댓글 달기

  • 다양한 방법이 있을 수 있는데요
    1. 파일을 프로세스별로 만들어서 저장후 크롤링이 끝나면 합치는 코드 작성
    2. multiprocessing의 lock기능 활용
    3. multiprocessing의 semaphore기능 활용
    4. 수집 클래스, 저장 클래스를 따로 만들어서 수집 클래스들이 저장 클래스의 큐에 값을 집어넣으면 저장 클래스가 큐에서 값을 하나씩 꺼내어 저장하는 방법(이때 수집 클래스의 속도를 조절하지 않으면 버퍼가 터질 수 있습니다)
    이정도가 생각나네요
  • @훈훈한 수국
    글쓴이글쓴이
    2020.5.16 13:00
    1,2번이 그나마 제 레벨에서 시도해볼 수 있는 방법 같네요!
    고수님 상세한 답변 감사합니다.
번호 제목 글쓴이 날짜
공지 욕설/반말시 글쓰기 권한 영구 정지10 저렴한 개불알꽃 2019.01.26
공지 식물원 이용규칙 (2018/09/30 최종 업데이트) - 학생회 관련 게시글, 댓글 가능17 흔한 달뿌리풀 2013.03.04
168339 오늘은 어버이의 날입니다 유치한 곰취 2026.05.08
168338 뭐여 주식 왜 이렇게 올랐어여 끔찍한 질경이 2026.05.06
168337 간만에 3일 휴가 ㅠㅠㅠㅠ2 활달한 머루 2026.05.01
168336 여행 많이 다니시는 분들은 저축은 어떻게 하시나요 따듯한 애기봄맞이 2026.04.26
168335 오늘 만덕센텀고속화도로 타봤는데 슬픈 호두나무 2026.04.23
168334 2년전에 건강검진 안 받고 올해 받았는데 다친 도깨비바늘 2026.04.19
168333 오피스텔 사는데 위층에서 물을 너무 많이 쓰네요 도도한 긴강남차 2026.04.14
168332 친구구합니다1 발랄한 왕원추리 2026.04.06
168331 그래도 요새는 영화관에서 나름 볼만한 영화가 꽤 있네요 무좀걸린 갈참나무 2026.04.04
168330 날씨는 좀 풀렸는데 세상은 아직 전쟁통이네요 기발한 개연꽃 2026.03.27
168329 예전에 자취하면서 먹었던 컵밥 같은 게 요샌 많이 없네요1 나쁜 큰괭이밥 2026.03.20
168328 15학번 동기들 잘지내나요3 근육질 먹넌출 2026.03.19
168327 이제 좀 전쟁이 끝나려나요 해박한 청가시덩굴 2026.03.18
168326 기름값이 너무 올랐던데 고상한 긴강남차 2026.03.14
168325 요새 주변에 애를 낳는 사람들이 많더라고요2 친근한 개양귀비 2026.03.10
168324 결국 이란에서 전쟁이 났네요 ㄷㄷㄷㄷ 저렴한 배롱나무 2026.02.28
168323 대규모 자료 잘 분석해주는 AI 뭐 있을까요1 무례한 갈참나무 2026.02.26
168322 요새 코인 노래방이 많이 없어지나요 해맑은 큰괭이밥 2026.02.23
168321 피누 복구되었네요 ㅠㅠㅠㅠ5 끔찍한 봉선화 2026.02.22
168320 [레알피누] 교양선택 5개 영역이상 이수에 브릿지 포함되나요?1 부자 꽈리 2026.01.12
첨부 (0)