Go to content

geek_stuff/web & network

야후 파이프. 좀더 자세하게

야후 파이프를 이용해서 웹툰을 RSS로 편리하게 보고 싶으신 레몬나무님을 포함한 여러 다른 분들의 의견을 모아 새로운 포스트를 작성하기로 했습니다.
다만 저도 초보이므로 틀린내용이 많을 것 같습니다,


간단히 위 파이프의 목적은 Fetch와 Rename Regex를 이용해서 Pipe Output으로 출력하는 건데,
 
Fetch의 URL은
해당 웹툰의 URL을 적어주시면 됩니다.
예를들어
 
제가 좋아하는 "와라 편의점"의 리스트 주소는 아래와 같습니다.
 
이제 이 URL을 Fetch의 URL에 넣어주시면 됩니다.
 
cut contents from은 해당 html에서 필요한 부분만 잘라내는건데,
해당 페이지의 소스를 확인해서 어디부터 새로 업데이트가 되는 것인지 확인을 합니다.


테이블이 시작하는 맨 위에서 첫번째의 정보만 필요하기에 위 이미지의 280번째 라인인 <td class="title">부터, 해당 링크가 끝나는 지점인 </td>까지 가져오도록 합니다.


Split using delimiter는 무슨 내용인지 모르겠는데 저걸 넣었더니 잘 구분이 되더군요.-_-;
여기까지 하면 item.content가 나오겠죠
그다음은 추출한 주소를 XML형식으로 바꿔줍니다.

Fetch Page에서 넘겨받은 데이터는 item.content 하나이므로 title, description으로 복사해주고 남은 내용을 link로 이름을 바꿔주면됩니다.

 

여기까지 하면 item.title, item.description, item.link가 나오겠죠.

 

이제 내용을 변경히켜줘야겠습니다.

 

item.title의 <a\b[^>]*>에 해당하는 내용은 이름을 넣어주면 되구요, (조금 더 복잡하게 html의 title을 가져오는 방법도 있습니다만, 조금 더 연구해봐야겠네요)

</a>는 공백(스페이스 한칸)으로.. (그래야 </a>가 지워지겠죠)

item.description도 놔두고, item.link는 원래 링크를 보존해야하므로 저렇게 넣어주시면 될듯 합니다.

 

그리고 pipe output으로 보내주면 끝~

 

조금 더 깨끗하게 만들고 싶지만 이정도에서 끝내는게 다른분들도 이해하기 쉬울 듯 싶네요.