야후 파이프를 이용해서 웹툰을 RSS로 편리하게 보고 싶으신 레몬나무님을 포함한 여러 다른 분들의 의견을 모아 새로운 포스트를 작성하기로 했습니다.
다만 저도 초보이므로 틀린내용이 많을 것 같습니다,


간단히 위 파이프의 목적은 Fetch와 Rename Regex를 이용해서 Pipe Output으로 출력하는 건데,
 
Fetch의 URL은
해당 웹툰의 URL을 적어주시면 됩니다.
예를들어
 
제가 좋아하는 "와라 편의점"의 리스트 주소는 아래와 같습니다.
http://comic.naver.com/webtoon/list.nhn?titleId=26316
 
이제 이 URL을 Fetch의 URL에 넣어주시면 됩니다.
 
cut contents from은 해당 html에서 필요한 부분만 잘라내는건데,
해당 페이지의 소스를 확인해서 어디부터 새로 업데이트가 되는 것인지 확인을 합니다.


테이블이 시작하는 맨 위에서 첫번째의 정보만 필요하기에 위 이미지의 280번째 라인인 <td class="title">부터, 해당 링크가 끝나는 지점인 </td>까지 가져오도록 합니다.


Split using delimiter는 무슨 내용인지 모르겠는데 저걸 넣었더니 잘 구분이 되더군요.-_-;
여기까지 하면 item.content가 나오겠죠
그다음은 추출한 주소를 XML형식으로 바꿔줍니다.

Fetch Page에서 넘겨받은 데이터는 item.content 하나이므로 title, description으로 복사해주고 남은 내용을 link로 이름을 바꿔주면됩니다.

 

여기까지 하면 item.title, item.description, item.link가 나오겠죠.

 

이제 내용을 변경히켜줘야겠습니다.

 

item.title의 <a\b[^>]*>에 해당하는 내용은 이름을 넣어주면 되구요, (조금 더 복잡하게 html의 title을 가져오는 방법도 있습니다만, 조금 더 연구해봐야겠네요)

</a>는 공백(스페이스 한칸)으로.. (그래야 </a>가 지워지겠죠)

item.description도 놔두고, item.link는 원래 링크를 보존해야하므로 저렇게 넣어주시면 될듯 합니다.

 

그리고 pipe output으로 보내주면 끝~

 

조금 더 깨끗하게 만들고 싶지만 이정도에서 끝내는게 다른분들도 이해하기 쉬울 듯 싶네요.

신고
Yahoo Pipes

Yahoo Pipes


몇달전인가 야후 파이프에 대한 소식이 블로그 스피어를 떠들썩하게 했었다.
잠깐 들어가보고는 뭔가 복잡해서 그땐 아 뭔가 재밌는게 있는가보다 하고 넘어가 버렸다.

개인적으로 웹툰을 매우 즐겨보기 때문에 오래전부터 (고맙게도)누군가 작성해둔 네이버 웹툰 RSS를 구독하고 있었는데, 두어달전부터 RSS가 정상적으로 업데이트 하지않게 된것을 알게 되었다.
당장은 그리 불편한것은 아니었다. 직접 들어가서 한꺼번에 보면되니깐...
하지만 이틀정도만 밀려버리면 하나씩 들어가서 웹툰을 확인하는 것이 너무너무 불편했다.

네이버 자체적으로 RSS를 지원해줬으면 정말 편했을텐데, (카페나 웹툰이나 같은 컨텐츠임에도 불구하고!) 웹툰에서는 RSS를 제공하고 있지 않아서, (회사에서 하는일 중 하나가 스크립트를 짜는 일인지라 잔머리는 잘 굴리기 때문에), 주말에 남는 시간동안 만들어보기로 했다.

문제는 내가 HTML을 제외한 PHP나 ASP같은 CGI쪽의 지식이 거의 전무하다는 것.

웹페이지를 RSS로 만들어주는 서비스들을 이용해보려고 하였으나, 단일페이지를 RSS 하나로 만드는 것들이 대부분이고, 확실히 뭔가 부족한점이 있었다.

그러던차에 야후 Pipes를 떠올리게 되었고, 거의 반나절동안 매달려보니 대충 어떻게 사용하는건지 감을 잡을수 있게 되었다. 모르는 것은 각 모듈에 있는 ?를 눌러주면 MSDN과 같이 예제와 상세한 설명을 볼수 있기때문에 처음부터 도움말을 정독하지 않아도 된다는 점은 큰 장점이라고 생각한다.

다만 단점은 AJAX를 사용하기에 IE에서는 성능이 매우 느리다. 때문에 빠른 자바스크립트 엔진을 사용하는 구글의 크롬브라우저로 웹사이트를 이용하기를 권장한다.

어쨌든 네이버의 웹툰 주소를 가져와서 필요한 부분을 잘라주는 Fetch Page모듈을 사용하고, 그 주소를 RSS로 변환하기 위해 title, description, link를 만들어주는 Rename 모듈을 연결, 남은 찌꺼기들을 제거하는 Regex 모듈을 이용해서 아웃풋으로 뿅하고 보내주면 간단하게 끝나는 일이었다.

Pipe Element

Simple Pipe Structure - 단순한 파이프 구조


Regular Expression(Regex)를 사용하는데 조금 애를 먹었지만 구글의 도움을 받아 대충 해결을(솔직히 그다지 어려운건 없었다.) 보았다.

그 이후엔 단순한 반복작업만이 있었을 뿐...
Massive Pipes Array

Massive Pipes Array - 마치 IDC의 서버와 네트워크 케이블 같다.


뭐 그렇게 해서 이를 RSS형태로 출력시키고 이를 feedburner에 연결해서 RSS주소를 고정시키면 끝.

그렇게 해서 얻은 결과가 바로 이것.

http://feeds.feedburner.com/naver_comic

생성한지 아직 하루밖에 안지나서 테스트가 된것이 아니기는 하지만 업데이트가 시작되면 RSS에 뜨지 않을까 하는 생각이 든다.

새로운 웹툰이나 업데이트가 잘 안되면 다른분들이 먼저 알고 리플을 달아주시지 않을까 하는 생각에 이곳에 포스팅해본다. 네이버에서 차단하려나?ㅋ
신고
 «이전 1  다음»