]> git.evergreen-ils.org Git - working/Evergreen.git/blob - Open-ILS/src/sql/Pg/upgrade/0743.schema.remove_tsearch2.sql
LP#1174359: follow-up on dropping the reporter.classic_item_list view
[working/Evergreen.git] / Open-ILS / src / sql / Pg / upgrade / 0743.schema.remove_tsearch2.sql
1 -- Evergreen DB patch 0743.schema.remove_tsearch2.sql
2 --
3 -- Enable native full-text search to be used, and drop TSearch2 extension
4 --
5 BEGIN;
6
7 -- check whether patch can be applied
8 SELECT evergreen.upgrade_deps_block_check('0743', :eg_version);
9
10 -- FIXME: add/check SQL statements to perform the upgrade
11 -- First up, these functions depend on metabib.full_rec. They have to go for now.
12 DROP FUNCTION IF EXISTS biblio.flatten_marc(bigint);
13 DROP FUNCTION IF EXISTS biblio.flatten_marc(text);
14
15 -- These views depend on metabib.full_rec as well. Bye-bye!
16 DROP VIEW IF EXISTS reporter.old_super_simple_record;
17 DROP VIEW IF EXISTS reporter.simple_record;
18 DROP VIEW IF EXISTS reporter.classic_item_list;
19
20 \echo WARNING: The reporter.classic_item_list view was dropped if it existed.
21 \echo If you use that view, please run the example.reporter-extension.sql script
22 \echo to recreate it after rest of the schema upgrade is complete.
23
24 -- Now we can drop metabib.full_rec.
25 DROP VIEW IF EXISTS metabib.full_rec;
26
27 -- These indexes have to go. BEFORE we alter the tables, otherwise things take extra time when we alter the tables.
28 DROP INDEX metabib.metabib_author_field_entry_value_idx;
29 DROP INDEX metabib.metabib_identifier_field_entry_value_idx;
30 DROP INDEX metabib.metabib_keyword_field_entry_value_idx;
31 DROP INDEX metabib.metabib_series_field_entry_value_idx;
32 DROP INDEX metabib.metabib_subject_field_entry_value_idx;
33 DROP INDEX metabib.metabib_title_field_entry_value_idx;
34
35 -- Now grab all of the tsvector-enabled columns and switch them to the non-wrapper version of the type.
36 ALTER TABLE authority.full_rec ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
37 ALTER TABLE authority.simple_heading ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
38 ALTER TABLE metabib.real_full_rec ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
39 ALTER TABLE metabib.author_field_entry ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
40 ALTER TABLE metabib.browse_entry ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
41 ALTER TABLE metabib.identifier_field_entry ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
42 ALTER TABLE metabib.keyword_field_entry ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
43 ALTER TABLE metabib.series_field_entry ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
44 ALTER TABLE metabib.subject_field_entry ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
45 ALTER TABLE metabib.title_field_entry ALTER COLUMN index_vector TYPE pg_catalog.tsvector;
46
47 -- Halfway there! Goodbye tsearch2 extension!
48 DROP EXTENSION tsearch2;
49
50 -- Next up, re-creating all of the stuff we just dropped.
51
52 -- Indexes! Note to whomever: Do we even need these anymore?
53 CREATE INDEX metabib_author_field_entry_value_idx ON metabib.author_field_entry (SUBSTRING(value,1,1024)) WHERE index_vector = ''::TSVECTOR;
54 CREATE INDEX metabib_identifier_field_entry_value_idx ON metabib.identifier_field_entry (SUBSTRING(value,1,1024)) WHERE index_vector = ''::TSVECTOR;
55 CREATE INDEX metabib_keyword_field_entry_value_idx ON metabib.keyword_field_entry (SUBSTRING(value,1,1024)) WHERE index_vector = ''::TSVECTOR;
56 CREATE INDEX metabib_series_field_entry_value_idx ON metabib.series_field_entry (SUBSTRING(value,1,1024)) WHERE index_vector = ''::TSVECTOR;
57 CREATE INDEX metabib_subject_field_entry_value_idx ON metabib.subject_field_entry (SUBSTRING(value,1,1024)) WHERE index_vector = ''::TSVECTOR;
58 CREATE INDEX metabib_title_field_entry_value_idx ON metabib.title_field_entry (SUBSTRING(value,1,1024)) WHERE index_vector = ''::TSVECTOR;
59
60 -- metabib.full_rec, with insert/update/delete rules
61 CREATE OR REPLACE VIEW metabib.full_rec AS
62     SELECT  id,
63             record,
64             tag,
65             ind1,
66             ind2,
67             subfield,
68             SUBSTRING(value,1,1024) AS value,
69             index_vector
70       FROM  metabib.real_full_rec;
71
72 CREATE OR REPLACE RULE metabib_full_rec_insert_rule
73     AS ON INSERT TO metabib.full_rec
74     DO INSTEAD
75     INSERT INTO metabib.real_full_rec VALUES (
76         COALESCE(NEW.id, NEXTVAL('metabib.full_rec_id_seq'::REGCLASS)),
77         NEW.record,
78         NEW.tag,
79         NEW.ind1,
80         NEW.ind2,
81         NEW.subfield,
82         NEW.value,
83         NEW.index_vector
84     );
85
86 CREATE OR REPLACE RULE metabib_full_rec_update_rule
87     AS ON UPDATE TO metabib.full_rec
88     DO INSTEAD
89     UPDATE  metabib.real_full_rec SET
90         id = NEW.id,
91         record = NEW.record,
92         tag = NEW.tag,
93         ind1 = NEW.ind1,
94         ind2 = NEW.ind2,
95         subfield = NEW.subfield,
96         value = NEW.value,
97         index_vector = NEW.index_vector
98       WHERE id = OLD.id;
99
100 CREATE OR REPLACE RULE metabib_full_rec_delete_rule
101     AS ON DELETE TO metabib.full_rec
102     DO INSTEAD
103     DELETE FROM metabib.real_full_rec WHERE id = OLD.id;
104
105 -- reporter views that depended on metabib.full_rec are up next
106 CREATE OR REPLACE VIEW reporter.simple_record AS
107 SELECT  r.id,
108     s.metarecord,
109     r.fingerprint,
110     r.quality,
111     r.tcn_source,
112     r.tcn_value,
113     title.value AS title,
114     uniform_title.value AS uniform_title,
115     author.value AS author,
116     publisher.value AS publisher,
117     SUBSTRING(pubdate.value FROM $$\d+$$) AS pubdate,
118     series_title.value AS series_title,
119     series_statement.value AS series_statement,
120     summary.value AS summary,
121     ARRAY_ACCUM( DISTINCT REPLACE(SUBSTRING(isbn.value FROM $$^\S+$$), '-', '') ) AS isbn,
122     ARRAY_ACCUM( DISTINCT REGEXP_REPLACE(issn.value, E'^\\S*(\\d{4})[-\\s](\\d{3,4}x?)', E'\\1 \\2') ) AS issn,
123     ARRAY((SELECT DISTINCT value FROM metabib.full_rec WHERE tag = '650' AND subfield = 'a' AND record = r.id)) AS topic_subject,
124     ARRAY((SELECT DISTINCT value FROM metabib.full_rec WHERE tag = '651' AND subfield = 'a' AND record = r.id)) AS geographic_subject,
125     ARRAY((SELECT DISTINCT value FROM metabib.full_rec WHERE tag = '655' AND subfield = 'a' AND record = r.id)) AS genre,
126     ARRAY((SELECT DISTINCT value FROM metabib.full_rec WHERE tag = '600' AND subfield = 'a' AND record = r.id)) AS name_subject,
127     ARRAY((SELECT DISTINCT value FROM metabib.full_rec WHERE tag = '610' AND subfield = 'a' AND record = r.id)) AS corporate_subject,
128     ARRAY((SELECT value FROM metabib.full_rec WHERE tag = '856' AND subfield IN ('3','y','u') AND record = r.id ORDER BY CASE WHEN subfield IN ('3','y') THEN 0 ELSE 1 END)) AS external_uri
129   FROM  biblio.record_entry r
130     JOIN metabib.metarecord_source_map s ON (s.source = r.id)
131     LEFT JOIN metabib.full_rec uniform_title ON (r.id = uniform_title.record AND uniform_title.tag = '240' AND uniform_title.subfield = 'a')
132     LEFT JOIN metabib.full_rec title ON (r.id = title.record AND title.tag = '245' AND title.subfield = 'a')
133     LEFT JOIN metabib.full_rec author ON (r.id = author.record AND author.tag = '100' AND author.subfield = 'a')
134     LEFT JOIN metabib.full_rec publisher ON (r.id = publisher.record AND publisher.tag = '260' AND publisher.subfield = 'b')
135     LEFT JOIN metabib.full_rec pubdate ON (r.id = pubdate.record AND pubdate.tag = '260' AND pubdate.subfield = 'c')
136     LEFT JOIN metabib.full_rec isbn ON (r.id = isbn.record AND isbn.tag IN ('024', '020') AND isbn.subfield IN ('a','z'))
137     LEFT JOIN metabib.full_rec issn ON (r.id = issn.record AND issn.tag = '022' AND issn.subfield = 'a')
138     LEFT JOIN metabib.full_rec series_title ON (r.id = series_title.record AND series_title.tag IN ('830','440') AND series_title.subfield = 'a')
139     LEFT JOIN metabib.full_rec series_statement ON (r.id = series_statement.record AND series_statement.tag = '490' AND series_statement.subfield = 'a')
140     LEFT JOIN metabib.full_rec summary ON (r.id = summary.record AND summary.tag = '520' AND summary.subfield = 'a')
141   GROUP BY 1,2,3,4,5,6,7,8,9,10,11,12,13,14;
142
143 CREATE OR REPLACE VIEW reporter.old_super_simple_record AS
144 SELECT  r.id,
145     r.fingerprint,
146     r.quality,
147     r.tcn_source,
148     r.tcn_value,
149     FIRST(title.value) AS title,
150     FIRST(author.value) AS author,
151     ARRAY_TO_STRING(ARRAY_ACCUM( DISTINCT publisher.value), ', ') AS publisher,
152     ARRAY_TO_STRING(ARRAY_ACCUM( DISTINCT SUBSTRING(pubdate.value FROM $$\d+$$) ), ', ') AS pubdate,
153     ARRAY_ACCUM( DISTINCT REPLACE(SUBSTRING(isbn.value FROM $$^\S+$$), '-', '') ) AS isbn,
154     ARRAY_ACCUM( DISTINCT REGEXP_REPLACE(issn.value, E'^\\S*(\\d{4})[-\\s](\\d{3,4}x?)', E'\\1 \\2') ) AS issn
155   FROM  biblio.record_entry r
156     LEFT JOIN metabib.full_rec title ON (r.id = title.record AND title.tag = '245' AND title.subfield = 'a')
157     LEFT JOIN metabib.full_rec author ON (r.id = author.record AND author.tag IN ('100','110','111') AND author.subfield = 'a')
158     LEFT JOIN metabib.full_rec publisher ON (r.id = publisher.record AND publisher.tag = '260' AND publisher.subfield = 'b')
159     LEFT JOIN metabib.full_rec pubdate ON (r.id = pubdate.record AND pubdate.tag = '260' AND pubdate.subfield = 'c')
160     LEFT JOIN metabib.full_rec isbn ON (r.id = isbn.record AND isbn.tag IN ('024', '020') AND isbn.subfield IN ('a','z'))
161     LEFT JOIN metabib.full_rec issn ON (r.id = issn.record AND issn.tag = '022' AND issn.subfield = 'a')
162   GROUP BY 1,2,3,4,5;
163
164 -- And finally, the biblio functions. NOTE: I can't find the original source of the second one, so I skipped it as old cruft that was in our production DB.
165 CREATE OR REPLACE FUNCTION biblio.flatten_marc ( rid BIGINT ) RETURNS SETOF metabib.full_rec AS $func$
166 DECLARE
167     bib biblio.record_entry%ROWTYPE;
168     output  metabib.full_rec%ROWTYPE;
169     field   RECORD;
170 BEGIN
171     SELECT INTO bib * FROM biblio.record_entry WHERE id = rid;
172
173     FOR field IN SELECT * FROM vandelay.flatten_marc( bib.marc ) LOOP
174         output.record := rid;
175         output.ind1 := field.ind1;
176         output.ind2 := field.ind2;
177         output.tag := field.tag;
178         output.subfield := field.subfield;
179         output.value := field.value;
180
181         RETURN NEXT output;
182     END LOOP;
183 END;
184 $func$ LANGUAGE PLPGSQL;
185
186 COMMIT;