]> git.evergreen-ils.org Git - Evergreen.git/blob - Open-ILS/src/sql/Pg/upgrade/0213.schema.config.metabib_field_class_stuff.sql
LP1894131 Sticky catalog holdings org select
[Evergreen.git] / Open-ILS / src / sql / Pg / upgrade / 0213.schema.config.metabib_field_class_stuff.sql
1
2 BEGIN;
3
4 INSERT INTO config.upgrade_log (version) VALUES ('0213');
5
6 CREATE TABLE config.metabib_class (
7     name    TEXT    PRIMARY KEY,
8     label   TEXT    NOT NULL UNIQUE
9 );
10
11 INSERT INTO config.metabib_class ( name, label ) VALUES ( 'keyword', oils_i18n_gettext('keyword', 'Keyword', 'cmc', 'label') );
12 INSERT INTO config.metabib_class ( name, label ) VALUES ( 'title', oils_i18n_gettext('title', 'Title', 'cmc', 'label') );
13 INSERT INTO config.metabib_class ( name, label ) VALUES ( 'author', oils_i18n_gettext('author', 'Author', 'cmc', 'label') );
14 INSERT INTO config.metabib_class ( name, label ) VALUES ( 'subject', oils_i18n_gettext('subject', 'Subject', 'cmc', 'label') );
15 INSERT INTO config.metabib_class ( name, label ) VALUES ( 'series', oils_i18n_gettext('series', 'Series', 'cmc', 'label') );
16
17 ALTER TABLE config.metabib_field ADD COLUMN label TEXT;
18 UPDATE config.metabib_field SET label = name;
19 ALTER TABLE config.metabib_field ALTER COLUMN label SET NOT NULL;
20
21 ALTER TABLE config.metabib_field ADD CONSTRAINT field_class_fkey FOREIGN KEY (field_class) REFERENCES config.metabib_class (name);
22
23 CREATE OR REPLACE FUNCTION biblio.extract_metabib_field_entry ( rid BIGINT, default_joiner TEXT ) RETURNS SETOF metabib.field_entry_template AS $func$
24 DECLARE
25     bib     biblio.record_entry%ROWTYPE;
26     idx     config.metabib_field%ROWTYPE;
27     xfrm        config.xml_transform%ROWTYPE;
28     prev_xfrm   TEXT;
29     transformed_xml TEXT;
30     xml_node    TEXT;
31     xml_node_list   TEXT[];
32     raw_text    TEXT;
33     curr_text   TEXT;
34     joiner      TEXT := default_joiner; -- XXX will index defs supply a joiner?
35     output_row  metabib.field_entry_template%ROWTYPE;
36 BEGIN
37
38     -- Get the record
39     SELECT INTO bib * FROM biblio.record_entry WHERE id = rid;
40
41     -- Loop over the indexing entries
42     FOR idx IN SELECT * FROM config.metabib_field ORDER BY format LOOP
43
44         SELECT INTO xfrm * from config.xml_transform WHERE name = idx.format;
45
46         -- See if we can skip the XSLT ... it's expensive
47         IF prev_xfrm IS NULL OR prev_xfrm <> xfrm.name THEN
48             -- Can't skip the transform
49             IF xfrm.xslt <> '---' THEN
50                 transformed_xml := oils_xslt_process(bib.marc,xfrm.xslt);
51             ELSE
52                 transformed_xml := bib.marc;
53             END IF;
54
55             prev_xfrm := xfrm.name;
56         END IF;
57
58         xml_node_list := oils_xpath( idx.xpath, transformed_xml, ARRAY[ARRAY[xfrm.prefix, xfrm.namespace_uri]] );
59
60         raw_text := NULL;
61         FOR xml_node IN SELECT x FROM explode_array(xml_node_list) AS x LOOP
62             CONTINUE WHEN xml_node !~ E'^\\s*<';
63
64             curr_text := ARRAY_TO_STRING(
65                 oils_xpath( '//text()',
66                     REGEXP_REPLACE( -- This escapes all &s not followed by "amp;".  Data ise returned from oils_xpath (above) in UTF-8, not entity encoded
67                         REGEXP_REPLACE( -- This escapes embeded <s
68                             xml_node,
69                             $re$(>[^<]+)(<)([^>]+<)$re$,
70                             E'\\1&lt;\\3',
71                             'g'
72                         ),
73                         '&(?!amp;)',
74                         '&amp;',
75                         'g'
76                     )
77                 ),
78                 ' '
79             );
80
81             CONTINUE WHEN curr_text IS NULL OR curr_text = '';
82
83             IF raw_text IS NOT NULL THEN
84                 raw_text := raw_text || joiner;
85             END IF;
86
87             raw_text := COALESCE(raw_text,'') || curr_text;
88
89             -- insert raw node text for faceting
90             IF idx.facet_field THEN
91
92                 output_row.field_class = idx.field_class;
93                 output_row.field = idx.id;
94                 output_row.source = rid;
95                 output_row.value = BTRIM(REGEXP_REPLACE(curr_text, E'\\s+', ' ', 'g'));
96
97                 RETURN NEXT output_row;
98             END IF;
99
100         END LOOP;
101
102         CONTINUE WHEN raw_text IS NULL OR raw_text = '';
103
104         -- insert combined node text for searching
105         IF idx.search_field THEN
106             output_row.field_class = idx.field_class;
107             output_row.field = idx.id;
108             output_row.source = rid;
109             output_row.value = BTRIM(REGEXP_REPLACE(raw_text, E'\\s+', ' ', 'g'));
110
111             RETURN NEXT output_row;
112         END IF;
113
114     END LOOP;
115
116 END;
117 $func$ LANGUAGE PLPGSQL;
118
119
120 COMMIT;
121