]> git.evergreen-ils.org Git - working/Evergreen.git/blob - Open-ILS/src/perlmods/lib/OpenILS/WWW/AddedContent.pm
ba770d185cfc77dd6cd64f38536fd30e887710ad
[working/Evergreen.git] / Open-ILS / src / perlmods / lib / OpenILS / WWW / AddedContent.pm
1 package OpenILS::WWW::AddedContent;
2 use strict; use warnings;
3
4 use CGI;
5 use Apache2::Log;
6 use Apache2::Const -compile => qw(OK REDIRECT DECLINED NOT_FOUND :log);
7 use APR::Const    -compile => qw(:error SUCCESS);
8 use Apache2::RequestRec ();
9 use Apache2::RequestIO ();
10 use Apache2::RequestUtil;
11 use Data::Dumper;
12 use UNIVERSAL::require;
13
14 use OpenSRF::EX qw(:try);
15 use OpenSRF::Utils::Cache;
16 use OpenSRF::System;
17 use OpenSRF::Utils::Logger qw/$logger/;
18 use OpenILS::Utils::CStoreEditor;
19
20 use LWP::UserAgent;
21 use MIME::Base64;
22
23 use Business::ISBN;
24 use Business::ISSN;
25
26 my $AC = __PACKAGE__;
27
28
29 # set the bootstrap config when this module is loaded
30 my $bs_config;
31
32 sub import {
33     my $self = shift;
34     $bs_config = shift;
35 }
36
37
38 my $handler; # added content handler class handle
39 my $cache; # memcache handle
40 my $net_timeout; # max seconds to wait for a response from the added content vendor
41 my $max_errors; # max consecutive lookup failures before added content is temporarily disabled
42 my $error_countdown; # current consecutive errors countdown
43
44 # number of seconds to wait before next lookup 
45 # is attempted after lookups have been disabled
46 my $error_retry_timeout;
47
48 # Cache Types/Formats for clearing purposes
49 my %cachetypes = (
50     jacket => ['small','medium','large'],
51     toc => ['html','json','xml'],
52     anotes => ['html','json','xml'],
53     excerpt => ['html','json','xml'],
54     reviews => ['html','json','xml'],
55     summary => ['html','json','xml'],
56 );
57
58 sub child_init {
59
60     OpenSRF::System->bootstrap_client( config_file => $bs_config );
61     $cache = OpenSRF::Utils::Cache->new;
62
63     my $sclient = OpenSRF::Utils::SettingsClient->new();
64     my $ac_data = $sclient->config_value("added_content");
65
66     return Apache2::Const::OK unless $ac_data;
67     my $ac_handler = $ac_data->{module};
68     return Apache2::Const::OK unless $ac_handler;
69
70     $net_timeout = $ac_data->{timeout} || 1;
71     $error_countdown = $max_errors = $ac_data->{max_errors} || 10;
72     $error_retry_timeout = $ac_data->{retry_timeout} || 600;
73
74     $logger->debug("Attempting to load Added Content handler: $ac_handler");
75
76     $ac_handler->use;
77
78     if($@) {    
79         $logger->error("Unable to load Added Content handler [$ac_handler]: $@"); 
80         return Apache2::Const::OK; 
81     }
82
83     $handler = $ac_handler->new($ac_data);
84     $logger->debug("added content loaded handler: $handler");
85     return Apache2::Const::OK;
86 }
87
88
89 sub handler {
90
91     my $r   = shift;
92
93     # If the URL requested matches a file on the filesystem, have Apache serve that file
94     # this allows for local content (most typically images) to be used for some requests
95     return Apache2::Const::DECLINED if (-e $r->filename);
96
97     my $cgi = CGI->new;
98     my @path_parts = split( /\//, $r->unparsed_uri );
99
100     # Intended URL formats
101     # /opac/extras/ac/jacket/medium/ISBN_VALUE      -- classic keyed-off-isbn
102     # /opac/extras/ac/-3/-2/-1
103     # /opac/extras/ac/jacket/medium/r/RECORD_ID     -- provide record id (bre.id)
104     # /opac/extras/ac/-4/-3/-2/-1
105     # /opac/extras/ac/jacket/medium/m/RECORD_ID     -- XXX: future use for metarecord id
106
107     my $keytype_in_url = $path_parts[-2];  # if not in one of m, r, this will be the $format
108
109     my $type;
110     my $format;
111     my $keytype;
112     my $keyvalue;
113
114     if ($keytype_in_url =~ m/^(r|m)$/) {
115         $type = $path_parts[-4];
116         $format = $path_parts[-3];
117         $keyvalue = $path_parts[-1]; # a record/metarecord id
118         $keytype = 'record';
119     } else {
120         $type = $path_parts[-3];
121         $format = $path_parts[-2];
122         $keyvalue = $path_parts[-1]; # an isbn
123         $keytype = 'isbn';
124     }
125
126     my $res;
127     my $keyhash;
128     my $cachekey;
129
130     $cachekey = ($keytype eq "isbn") ? $keyvalue : $keytype . '_' . $keyvalue;
131
132     child_init() unless $handler;
133
134     return Apache2::Const::NOT_FOUND unless $handler and $type and $format and $cachekey;
135
136     if ($type eq "clearcache") {
137         return $AC->clear_cache($format, $cachekey);
138     }
139
140     my $err;
141     my $data;
142     my $method = "${type}_${format}";
143
144     return Apache2::Const::NOT_FOUND unless $handler->can($method);
145     return $res if defined($res = $AC->serve_from_cache($type, $format, $cachekey));
146     return Apache2::Const::NOT_FOUND unless $AC->lookups_enabled;
147
148     if ($keytype eq "isbn") { # if this request uses isbn for the key
149         # craft a hash with the single isbn, because that's all we will have
150         $keyhash = {};
151         $keyhash->{"isbn"} = [$keyvalue];
152     } else {
153         my $key_data = get_rec_keys($keyvalue);
154         my @isbns = grep {$_->{tag} eq '020'} @$key_data;
155         my @issns = grep {$_->{tag} eq '022'} @$key_data;
156         my @upcs  = grep {$_->{tag} eq '024'} @$key_data;
157
158         map {
159             # Attempt to validate the ISBN.
160             # strip out hyphens;
161             $_->{value} =~ s/-//g;
162             #pull out the first chunk that looks like an ISBN:
163             if ($_->{value} =~ /([0-9xX]{10}(?:[0-9xX]{3})?)/) {
164                 $_->{value} = $1;
165                 my $isbn_obj = Business::ISBN->new($_->{value});
166                 my $isbn_str;
167                 $isbn_str = $isbn_obj->as_string([]) if defined($isbn_obj);
168                 $_->{value} = $isbn_str;
169             } else {
170                 undef $_->{value};
171             }
172             undef $_ if !defined($_->{value});
173         } @isbns;
174
175         map {
176             my $issn_obj = Business::ISSN->new($_->{value});
177             my $issn_str;
178             $issn_str = $issn_obj->as_string() if defined($issn_obj && $issn_obj->is_valid);
179             $_->{value} = $issn_str;
180             undef $_ if !defined($_->{value});
181         } @issns;
182
183         $keyhash = {
184             isbn => [map {$_->{value}} @isbns],
185             issn => [map {$_->{value}} @issns],
186             upc  => [map {$_->{value}} @upcs]
187         };
188     }
189
190     return Apache2::Const::NOT_FOUND unless @{$keyhash->{isbn}} || @{$keyhash->{issn}} || @{$keyhash->{upc}};
191
192     try {
193         if ($handler->can('expects_keyhash') && $handler->expects_keyhash() eq 1) {
194             # Handler expects a keyhash
195             $data = $handler->$method($keyhash);
196         } else {
197             # Pass single ISBN as a scalar to the handler
198             $data = $handler->$method($keyhash->{isbn}[0]);
199         }
200     } catch Error with {
201         $err = shift;
202         decr_error_countdown();
203         $logger->debug("added content handler failed: $method($keytype/$keyvalue) => $err"); # XXX: logs unhelpful hashref
204     };
205
206     return Apache2::Const::NOT_FOUND if $err;
207
208     if(!$data) {
209         # if the AC lookup found no corresponding data, cache that information
210         $logger->debug("added content handler returned no results $method($keytype/$keyvalue)") unless $data;
211         $AC->cache_result($type, $format, $cachekey, {nocontent=>1});
212         return Apache2::Const::NOT_FOUND;
213     }
214     
215     $AC->print_content($data);
216     $AC->cache_result($type, $format, $cachekey, $data);
217
218     reset_error_countdown();
219     return Apache2::Const::OK;
220 }
221
222 # returns [{tag => $tag, value => $value}, {tag => $tag2, value => $value2}]
223 sub get_rec_keys {
224     my $id = shift;
225     return OpenILS::Utils::CStoreEditor->new->json_query({
226         select => {mfr => ['tag', 'value']},
227         from => 'mfr',
228         where => {
229             record => $id,
230             '-or' => [
231                 {
232                     '-and' => [
233                         {tag => '020'},
234                         {subfield => 'a'}
235                     ]
236                 }, {
237                     '-and' => [
238                         {tag => '022'},
239                         {subfield => 'a'}
240                     ]
241                 }, {
242                     '-and' => [
243                         {tag => '024'},
244                         {subfield => 'a'},
245                         {ind1 => 1}
246                     ]
247                 }
248             ]
249         },
250         order_by => [
251                 { class => 'mfr', field => 'id' }
252             ]
253     });
254 }
255
256 sub print_content {
257     my($class, $data, $from_cache) = @_;
258     return Apache2::Const::NOT_FOUND if $data->{nocontent};
259
260     my $ct = $data->{content_type};
261     my $content = $data->{content};
262     print "Content-type: $ct\n\n";
263
264     if($data->{binary}) {
265         binmode STDOUT;
266         # if it hasn't been cached yet, it's still in binary form
267         print( ($from_cache) ? decode_base64($content) : $content );
268     } else {
269         print $content;
270     }
271
272
273     return Apache2::Const::OK;
274 }
275
276
277
278
279 # returns an HTPP::Response object
280 sub get_url {
281     my( $self, $url ) = @_;
282
283     $logger->info("added content getting [timeout=$net_timeout, errors_remaining=$error_countdown] URL = $url");
284     my $agent = LWP::UserAgent->new(timeout => $net_timeout);
285
286     my $res = $agent->get($url); 
287     $logger->info("added content request returned with code " . $res->code);
288     die "added content request failed: " . $res->status_line ."\n" unless $res->is_success;
289
290     return $res;
291 }
292
293 # returns an HTPP::Response object
294 sub post_url {
295     my( $self, $url, $content ) = @_;
296
297     $logger->info("added content getting [timeout=$net_timeout, errors_remaining=$error_countdown] URL = $url");
298     my $agent = LWP::UserAgent->new(timeout => $net_timeout);
299
300     my $res = $agent->post($url, Content => $content);
301     $logger->info("added content request returned with code " . $res->code);
302     die "added content request failed: " . $res->status_line ."\n" unless $res->is_success;
303
304     return $res;
305 }
306
307 sub lookups_enabled {
308     if( $cache->get_cache('ac.no_lookup') ) {
309         $logger->info("added content lookup disabled");
310         return undef;
311     }
312     return 1;
313 }
314
315 sub disable_lookups {
316     $cache->put_cache('ac.no_lookup', 1, $error_retry_timeout);
317 }
318
319 sub decr_error_countdown {
320     $error_countdown--;
321     if($error_countdown < 1) {
322         $logger->warn("added content error count exhausted.  Disabling lookups for $error_retry_timeout seconds");
323         $AC->disable_lookups;
324     }
325 }
326
327 sub reset_error_countdown {
328     $error_countdown = $max_errors;
329 }
330
331 sub cache_result {
332     my($class, $type, $format, $key, $data) = @_;
333     $logger->debug("caching $type/$format/$key");
334     $data->{content} = encode_base64($data->{content}) if $data->{binary};
335     return $cache->put_cache("ac.$type.$format.$key", $data);
336 }
337
338 sub serve_from_cache {
339     my($class, $type, $format, $key) = @_;
340     my $data = $cache->get_cache("ac.$type.$format.$key");
341     return undef unless $data;
342     $logger->debug("serving $type/$format/$key from cache");
343     return $class->print_content($data, 1);
344 }
345
346 sub delete_from_cache {
347     my($class, $type, $format, $key) = @_;
348     my $data = $cache->get_cache("ac.$type.$format.$key");
349     if ($data) {
350         $logger->debug("deleting $type/$format/$key from cache");
351         $cache->delete_cache("ac.$type.$format.$key");
352         return 1;
353     }
354     return 0;
355 }
356
357 sub clear_cache {
358     my($class, $category, $key) = @_;
359     my $data = {
360         content_type => 'text/plain',
361         content => "Checking/Clearing Cache Entries for $key\n"
362     };
363     my @cleartypes = ($category);
364     if ($category eq 'all') {
365         @cleartypes = keys(%cachetypes);
366     }
367     for my $type (@cleartypes) {
368         for my $format (@{$cachetypes{$type}}) {
369             if ($class->delete_from_cache($type, $format, $key)) {
370                 $data->{content} .= "Cleared $type/$format\n";
371             }
372         }
373     }
374     $data->{content} .= "Done Checking $key\n";
375     return $class->print_content($data, 0);
376 }
377
378 1;