]> git.evergreen-ils.org Git - Evergreen.git/blob - docs/cataloging/batch_importing_MARC.adoc
Docs: small changes to record bucket docs
[Evergreen.git] / docs / cataloging / batch_importing_MARC.adoc
1 Batch Importing MARC Records
2 ----------------------------
3
4 Introduction
5 ~~~~~~~~~~~~
6
7 indexterm:[MARC records,importing,using the staff client]
8
9 [[batchimport]]
10 The cataloging module includes an enhanced MARC Batch Import interface for
11 loading MARC (and MARCXML) records. In general, it can handle batches up to 5,000 records
12 without a problem. This interface allows you to specify match points
13 between incoming and existing records, to specify MARC fields that should be
14 overlaid or preserved, and to only overlay records if the incoming record is
15 of higher quality than the existing record. Records are added to a queue where
16 you can apply filters that enable you to generate any errors that may have
17 occurred during import. You can print, email or export your queue as a CSV file.
18
19 Permissions
20 ~~~~~~~~~~~
21
22 To use match sets to import records, you will need the following permission:
23
24 ADMIN_IMPORT_MATCH_SET
25
26
27 Record Display Attributes
28 ~~~~~~~~~~~~~~~~~~~~~~~~~
29
30 This feature enables you to specify the tags and subfields that will display in
31 records that appear in the import queue. 
32
33
34 [[matchsets]]
35 Record Match Sets
36 ~~~~~~~~~~~~~~~~~
37
38 This feature enables you to create custom match points that you can use to
39 accurately match incoming records with existing catalog records.  
40   
41 Creating a Match Set
42 ^^^^^^^^^^^^^^^^^^^^
43
44 In this example, to demonstrate matching on record attributes and MARC tags and
45 subfields, we will create a record match set that defines a match based on the
46 title of the record, in either the 240 or 245, and the fixed field, Lang.  You
47 can add multiple record attributes and MARC tags to customize a record match
48 set.
49  
50
51 . Click *Cataloging -> MARC Batch Import/Export*.
52
53 . Create a new record match set.  Click *Record Match Sets -> New Match Set*.
54
55 . Enter a name for the record match set.
56
57 . Select an *Owning Library* from the drop down menu.  Staff with permissions
58 at this location will be able to use this record match set.
59
60 . Select a *Match Set Type* from the drop down menu.  You can create a match
61 set for authority records or bibliographic records.
62
63 . Click *Save*.
64 +
65 image::media/Batch_Importing_MARC_Records1.jpg[Batch_Importing_MARC_Records1]
66
67 . The screen will refresh to list the record match set that you created. Click
68 the link to the record match set.
69
70 . Create an expression that will define the match points for the incoming
71 record.  You can choose from two areas to create a match: *Record Attribute* or
72 *MARC Tag and Subfield*.  You can use the Boolean operators AND and OR to
73 combine these elements to create a match set.
74
75 . Select a *Record Attribute* from the drop-down menu.
76
77 . Enter a *Match Score.*  The *Match Score* indicates the relative importance
78 of that match point as Evergreen evaluates an incoming record against an
79 existing record. You can enter any integer into this field.  The number that
80 you enter is only important as it relates to other match points.  Recommended
81 practice is that you create a match score of one (1) for the least important
82 match point and assign increasing match points to the power of 2 to working
83 points in increasing importance.
84
85 . Check the *Negate?* box if you want to negate the match point. Checking
86 this box would be the equivalent of applying a Boolean operator of NOT to the
87 match point.
88 +
89 image::media/Batch_Importing_MARC_Records2.jpg[Batch_Importing_MARC_Records2]
90
91 . Click *Ok.*
92
93 . Drag the completed match point under the folder with the
94 appropriately-named Boolean folder under the Expression tree.
95 +
96 image::media/Batch_Importing_MARC_Records3.jpg[Batch_Importing_MARC_Records3]
97 +
98 The match point will nest underneath the folder in the Expression tree.
99 +
100 image::media/Batch_Importing_MARC_Records4.jpg[Batch_Importing_MARC_Records4]
101
102 . Enter another *Boolean Operator* to further refine your match set.
103
104 . Click *Boolean Operator*.
105
106 . Select the *OR* operator from the drop down menu.
107
108 . Click *Ok*.
109
110 . Drag the operator to the expression tree.
111 +
112 image::media/Batch_Importing_MARC_Records5.jpg[Batch_Importing_MARC_Records5]
113
114 . Click *MARC Tag and Subfield*.
115
116 . Enter a *MARC tag* on which you want the records to match.
117
118 . Enter a *subfield* on which you want the records to match.
119
120 . Enter a *Match Score.*  The *Match Score* indicates the relative importance
121 of that match point as Evergreen evaluates an incoming record against an
122 existing record. You can enter any integer into this field.  The number that
123 you enter is only important as it relates to other match points.  Recommended
124 practice is that you create a match score of one (1) for the least important
125 match point and assign increasing match points to the power of 2 to working
126 points in increasing importance.
127
128 . Check the *Negate?* box if you want to negate the match point.  Checking
129 this box would be the equivalent of applying a Boolean operator of NOT to the
130 match point.
131
132 . Click *Ok.*
133 +
134 image::media/Batch_Importing_MARC_Records6.jpg[Batch_Importing_MARC_Records6]
135
136 . Drag the completed match point under the folder with the
137 appropriately-named Boolean folder under the Expression tree. The Expression
138 will build across the top of the screen.
139
140 . Add additional MARC tags or record attributes to build the expression tree.
141
142 . Click *Save Changes to Expression*.
143 +
144 image::media/Batch_Importing_MARC_Records7.jpg[Batch_Importing_MARC_Records7]
145
146 Replace Mode
147 ^^^^^^^^^^^^
148
149 Replace Mode enables you to replace an existing part of the expression tree
150 with a new record attribute, MARC tag, or Boolean operator.  For example, if
151 the top of the tree is AND, in replace mode, you could change that to an OR.
152
153 . Create a working match point.
154
155 . Click *Enter replace mode*.
156
157 . Highlight the piece of the tree that you want to replace.
158
159 . Drag the replacement piece over the highlighted piece.
160
161 . Click *Exit Replace Mode*.
162
163
164 Quality Metrics
165 ^^^^^^^^^^^^^^^
166
167 . Set the *Quality Metrics for this Match Set*.  Quality metrics are used to
168 determine the overall quality of a record.  Each metric is given a weight and
169 the total quality value for a record is equal to the sum of all metrics that
170 apply to that record.  For example, a record that has been cataloged thoroughly
171 and contains accurate data would be more valuable than one of poor quality. You
172 may want to ensure that the incoming record is of the same or better quality
173 than the record that currently exists in your catalog; otherwise, you may want
174 the match to fail.  The quality metric is optional.
175
176 . You can create quality metrics based on the record attribute or the MARC Tag
177 and Subfield.
178
179 . Click *Record Attribute.*
180
181 . Select an attribute from the drop down menu.
182
183 . Enter a value for the attribute.
184
185 . Enter a match score.  You can enter any integer into this field. The number
186 that you enter is only important as it relates to other quality values for the
187 current configuration.  Higher scores would indicate increasing quality of
188 incoming records. You can, as in the expression match score, increase the
189 quality points by increasing subsequent records by a power of 2 (two).
190
191 . Click *Ok*.
192 +
193 image::media/Batch_Importing_MARC_Records8.jpg[Batch_Importing_MARC_Records8]
194
195 Merge/Overlay Profiles
196 ~~~~~~~~~~~~~~~~~~~~~~
197
198 If Evergreen finds a match for an incoming record in the database, you need to identify which fields should be replaced, which should be preserved, and which should be added to the record.
199 Click the Merge/Overlay Profiles button to create a profile that contains this information.
200
201 You can use these profiles when importing records through the MARC Batch Importer or Acquisitions Load MARC Order Records interface.
202
203 You can create a new profile by clicking the New Merge Profile button. Available options for handling the fields include:
204
205 . _Preserve specification_ - fields in the existing record that should be preserved.
206
207 . _Replace specification_ - fields in existing record that should be replaced by those in the incoming record.
208
209 . _Add specification_ - fields from incoming record that should be added to existing record (in addition to any already there.)
210
211 . _Remove specification_ - fields that should be removed from incoming record.
212
213 . _Update bib source_ - If this value is false, just the bibliographic data will be updated when you overlay a new MARC record.  If it is true, then Evergreen will also update
214 the record's bib source to the one you select on import; the last edit date to the date the new record is imported, and the last editor to the person who imported the new
215 record.
216
217 You can add multiple tags to the specification options, separating each tag with a comma.
218
219
220 Import Item Attributes
221 ~~~~~~~~~~~~~~~~~~~~~~
222 If you are importing copies with your records, you will need to map the data in
223 your holdings tag to fields in the copy record. Click the *Holdings Import
224 Profile* button to map this information.
225
226 . Click the *New Definition* button to create a new mapping for the holdings tag.
227 . Add a *Name* for the definition.
228 . Use the *Tag* field to identify the MARC tag that contains your holdings
229   information.
230 . Add the subfields that contain specific copy information to the appropriate
231   copy field.
232 . At a minimum, you should add the subfields that identify the *Circulating
233 Library*, the *Owning Library*, the *Call Number* and the *Barcode*.
234
235 NOTE: All fields (except for Name and Tag) can contain a MARC subfield code
236 (such as "a") or an XPATH query. You can also use the
237 related library settings to set defaults for some of these fields.
238
239 image::media/batch_import_profile.png[Partial Screenshot of a Holdings Import Profile]
240
241 .Holdings Import Profile Fields
242 [options="header"]
243 |=============================
244 |Field | Recommended | Description
245 |Name | Yes | Name you will choose from the MARC Batch Import screen
246 |Tag | Yes | MARC Holdings Tag/Field (e.g. 949). Use the Tag field to
247 identify the MARC tag that contains your holdings information.
248 |Barcode | Yes |
249 |Call Number | Yes |
250 |Circulating Library | Yes |
251 |Owning Library | Yes |
252 |Alert Message ||
253 |Circulate ||
254 |Circulate As MARC Type ||
255 |Circulation Modifier ||
256 |Copy Number ||
257 |Deposit ||
258 |Deposit Amount ||
259 |Holdable ||
260 |OPAC Visible ||
261 |Overlay Match ID || The copy ID of an existing copy to overlay
262 |Parts Data || Of the format `PART LABEL 1\|PART LABEL 2`.
263 |Price ||
264 |Private Note ||
265 |Public Note ||
266 |Reference ||
267 |Shelving Location ||
268 |Stat Cat Data || Of the format `CATEGORY 1\|VALUE 1\|\|CATEGORY 2\|VALUE 2`.
269 If you are overlaying existing copies which already have stat cats
270 attached to them, the overlay process will keep those values unless the
271 incoming copies contain updated values for matching categories.
272 |Status ||
273 |==================
274
275
276 Import Records
277 ~~~~~~~~~~~~~~
278
279 The *Import Records* interface incorporates record match sets, quality metrics,
280 more merging options, and improved ways to manage your queue.  In this example,
281 we will import a batch of records.  One of the records in the queue will
282 contain a matching record in the catalog that is of lower quality than the
283 incoming record.  We will import the record according to the guidelines set by
284 our record match set, quality metrics, and merge/overlay choices that we will
285 select.
286
287 . Select a *Record Type* from the drop down menu.
288
289 . Create a queue to which you can upload your records, or add you records to
290 an existing queue.  Queues are linked to match sets and a holdings import
291 profile. You cannot change a holdings import or record match set for a queue.
292
293 . Select a *Record Match Set* from the drop down menu.
294
295 . Select a *Holdings Import Profile* if you want to import holdings that are
296 attached to your records.
297
298 . Select a *Record Source* from the drop down menu.
299
300 . Select a *Merge Profile*.  Merge profiles enable you to specify which tags
301 should be removed or preserved in incoming records.
302
303 . Choose one of the following import options if you want to auto-import
304 records:
305
306 .. *Merge on Single Match* - Using the Record Match Set, Evergreen will only
307 attempt to perform the merge/overlay action if only one match was found in the
308 catalog.
309
310 .. *Merge on Best Match* - If more than one match is found in the catalog for a
311 given record, Evergreen will attempt to perform the merge/overlay action with
312 the best match as defined by the match score and quality metric.
313 +
314 NOTE: Quality ratio affects only the *Merge on Single Match* and *Merge on Best
315 Match* options.
316
317 . Enter a *Best/Single Match Minimum Quality Ratio.*  Divide the incoming
318 record quality score by the record quality score of the best match that might
319 exist in the catalog.  By default, Evergreen will assign any record a quality
320 score of 1 (one).  If you want to ensure that the inbound record is only
321 imported when it has a higher quality than the best match, then you must enter
322 a ratio that is higher than 1.  For example, if you want the incoming record to
323 have twice the quality of an existing record, then you should enter a 2 (two)
324 in this field.  If you want to bypass all quality restraints, enter a 0 (zero)
325 in this field.
326
327 . Select an *Insufficient Quality Fall-Through Profile* if desired.  This
328 field enables you to indicate that if the inbound record does not meet the
329 configured quality standards, then you may still import the record using an
330 alternate merge profile.  This field is typically used for selecting a merge
331 profile that allows the user to import holdings attached to a lower quality
332 record without replacing the existing (target) record with the incoming record.
333 This field is optional.  
334
335 . Under *Copy Import Actions*, choose _Auto-overlay In-process Acquisitions
336 Copies_ if you want to overlay temporary copies that were created by the
337 Acquisitions module.  The system will attempt to overlay copies that:
338
339 * have associated lineitem details (that is, they were created by the acquisitions process),
340 * that lineitem detail has the same owning_lib as the incoming copy's owning_lib, and
341 * the current copy associated with that lineitem detail is _In process_.
342
343 . *Browse* to find the appropriate file, and click *Upload*.  The file will
344 be uploaded to a queue. The file can be in either MARC or MARCXML format.
345 +
346 image::media/marc_batch_import_acq_overlay.png[Batch Importing MARC Records]
347
348 . The screen will display records that have been uploaded to your queue. Above
349 the table there are three sections:
350   * *Queue Actions* lists common actions for this queue. _Export Non-Imported
351 Records_ will export a MARC file of records that failed to import, allowing
352 those records to be edited as needed and imported separately. (Those
353 records can be viewed by clicking the _Limit to Non-Imported Records_
354 filter.)
355   * *Queue Summary* shows a brief summary of the records included in the queue.
356   * *Queue Filters* provides options for limiting which records display in the
357 table.
358 +
359 image::media/Batch_Importing_MARC_Records15.jpg[Batch_Importing_MARC_Records15]
360
361 . If Evergreen indicates that matching records exist, then click the
362 *Matches* link to view the matching records.  Check the box adjacent to the
363 existing record that you want to merge with the incoming record. 
364 +
365 image::media/Batch_Importing_MARC_Records10.jpg[Batch_Importing_MARC_Records10]
366
367 . Click *Back to Import Queue*.
368
369 . Check the boxes of the records that you want to import, and click *Import
370 Selected Records*, or click *Import All Records*.
371
372 . A pop up window will offer you the same import choices that were present on
373 the *Import Records* screen.  You can choose one of the import options, or
374 click *Import*.
375 +
376 image::media/marc_batch_import_popup.png[Batch Importing MARC Records Popup]
377
378 . The screen will refresh.  The *Queue Summary* indicates that the record was
379 imported.  The *Import Time* column records the date that the record was
380 imported. Also, the *Imported As* column should now display the database ID (also known as the bib record number) for the imported record.
381 +
382 image::media/Batch_Importing_MARC_Records12.jpg[Batch_Importing_MARC_Records12] 
383
384 . You can confirm that the record was imported by using the value of the *Imported As* column by selecting the menu *Cataloging* -> *Retrieve title by database ID* and using the supplied *Imported As* number. Alternatively, you can search the catalog to confirm that the record was imported.
385 +
386 image::media/Batch_Importing_MARC_Records14.jpg[Batch_Importing_MARC_Records14] 
387
388
389 Default Values for Item Import 
390 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
391
392 Evergreen now supports additional functionality for importing items through *Cataloging* -> *MARC Batch Import/Export*.  When items are imported via a *Holdings Import Profile* in *Cataloging* -> *MARC Batch Import/Export*, Evergreen will create an item-level record for each copy.  If an item barcode, call number, copy location, or circulation modifier is not set in the embedded holdings, Evergreen will apply a default value based on the configured Library Settings.  A default prefix can be applied to the auto-generated call numbers and item barcodes.
393
394 The following *Library Settings* can be configured to apply these default values to imported items:
395
396 * *Vandelay: Generate Default Barcodes* —Auto-generate default item barcodes when no item barcode is present
397
398 * *Vandelay: Default Barcode Prefix* —Apply this prefix to any auto-generated item barcodes
399
400 * *Vandelay: Generate Default Call Numbers* —Auto-generate default item call numbers when no item call number is present
401
402 * *Vandelay: Default Call Number Prefix* —Apply this prefix to any auto-generated item call numbers
403
404 * *Vandelay: Default Copy Location* —Default copy location value for imported items
405
406 * *Vandelay: Default Circulation Modifier* —Default circulation modifier value for imported items
407